Google introduceert Parsey McParseface: 's werelds beste grammaticus
Google maakt bekend dat het ’s werelds meest accurate ‘parser’ heeft ontwikkeld. De plug-in is gebaseerd op het nieuwe SyntaxNet, een framework voor programma’s die taal analyseren en begrijpen. Met de code die Google vrijgeeft, wordt het mogelijk om zulke modellen te programmeren. Bovendien wordt ook de kant-en-klare parser Parsey McParseface gedeeld.
Mensentaal is moeilijk
Parsey McParseface is in essentie een tool die menselijk taal kan ontleden. Zo kan een zin niet alleen worden opgedeeld in woorden, maar kan ook elke syntactische functie worden aangeduid. Bij de zin “Lies zag Bob”, zou Pasey McParseface accuraat kunnen beoordelen dat de zin bestaat uit subject, werkwoord en lijdend voorwerp.
Dat is bij korte zinnen meestal niet zo moeilijk te achterhalen, en zo goed als alle parsers zullen die zin goed benoemen. Problematisch wordt het pas wanneer zinnen meer ambigu worden. Menselijke taal is doordrenkt van dubbelzinnige en genuanceerde constructies die natuurlijk zijn voor ons, maar onbegrijpelijk voor computerlogica.
Volgens Google kan een zin van ongeveer twintig woorden honderden of wel duizenden mogelijke syntactische constructies hebben. Een parser zal ze allemaal moeten overwegen, en kiest dan vaak voor een foute optie.
Beste leerling van de klas
Om die ambiguïteit te ontrafelen, maken de parsers op SyntaxNet gebruik van neurale netwerken. De zin wordt van links naar rechts geanalyseerd en de zinsdelen benoemd. Omdat op dat moment verschillende hypotheses voor syntactische functies opduiken, worden deze tijdens het analyseren voorzien van scores. Die ‘beam search’-methode is cruciaal, zegt Google. “In plaats van bij elke stap meteen de ‘first-best’-beslissing te nemen, worden meerdere, gedeeltelijke hypotheses bijgehouden, waarbij die hypotheses enkel vervallen wanneer er verschillende andere hypotheses overblijven met hogere scores.” Uit de testen waaraan Parsey McParseface werd onderworpen, bleek dat het model 94 procent scoorde op het accuraat benoemen van woorden, een nooit eerder gezien resultaat.
Computergrammatica
Zulke scores betekenen een doorbraak voor toepassingen zoals het verbeteren van chatbots, communicatie of het internet af te schuimen naar informatie. Bovendien lijkt het model nu menselijke prestaties te benaderen: Google meent dat dat percentage rond de 97 schommelt, en dat alleen voor getrainde professionals.
Een van de laatste struikelblokken blijft echter het ontbreken van contextuele kennis. In de zin “Ik zag Lies op de straat in haar auto rijden” weten we dat de auto op de straat reed. Een parser heeft die wereldkennis niet, en kan weleens beslissen dat de straat zich in de auto van Lies bevond. Hoewel dat probleem al sterk verbeterd is met behulp van machine learning, blijft het voorlopig een obstakel.