Artificiële intelligentie leert op dezelfde manier als kinderen
Het Chinese bedrijf Baidu leert een artificiële intelligentie taken op dezelfde manier aan als kinderen bijleren. Door positieve en negatieve feedback te geven en in natuurlijke taal te communiceren met een robot is het bedrijf erin geslaagd een AI te creëren die doorheen een doolhof kan manoeuvreren. Net als een baby leert de artificiële intelligentie doormiddel van trial en error.
Doolhof
Het onderzoek van Baidu vindt plaats in een tweedimensionaal doolhof, waarin zich stukken fruit bevinden. Een virtuele leerkracht geeft de robot instructies in natuurlijke taal om hem te leren hoe hij doorheen het doolhof moet bewegen. In het begin begrijpt de AI geen enkel woord van wat de leerkracht zegt. Doordat de docent eveneens beloningen en straffen geeft, leert de babyrobot stilletjes aan de commando’s begrijpen. Dit proces wordt versneld doordat de leerkracht eveneens eenvoudige vragen stelt over de omgeving van de robot. Door positieve en negatieve feedback te geven, leert de AI natuurlijke taal kennen.
Uiteindelijke begrijpt de robot de commando’s van de leerkracht correct en navigeert de AI naar de juiste locaties. Zelfs nieuwe commando’s kunnen door de AI correct worden geïnterpreteerd, wanneer de leerkracht in het verleden voldoende soortgelijke zinnen heeft gebruikt. Dit principe klinkt voor mensen erg eenvoudig, maar werd in het verleden door artificiële intelligentie slecht toegepast.
“Een persoon die heeft geleerd om een appel met een mes te snijden, zal hoogstwaarschijnlijk weten hoe hij een watermeloen met een mes moet snijden. Kennis die in het verleden werd opgedaan toepassen voor een nieuwe taak is eenvoudig voor mensen. Huidige learning machines hebben hiermee echter moeite. Ook al weet een machine hoe een watermeloen eruit ziet, dan zal hij nog steeds niet weten hoe hij het moet snijden. Onze robot demonstreerde het vermogen om de informatie die hij kende over het uiterlijk van een watermeloen en de taak ‘snijden’ correct toe te passen om de taak uit te voeren, zonder dat hij hiervoor expliciet werd getraind,” schrijft Baidu in een blogpost.
Proof of concept
Het onderzoek van Baidu fungeert als een proof of concept waarin wordt bewezen dat algoritmes in staat zijn om gelijktijdig taal en navigatie te leren en deze kennis op een soortgelijke manier als mensen kunnen gebruiken. De onderzoekers hopen dat ze hun studie kunnen verderzetten in een 3D-omgeving en de technologie kunnen gebruiken om een intuïtievere robot te creëren.