Google vertaalt alle talen, ook als het die niet kent
Iedereen lacht wel eens met de vertaalkwaliteit van Google Translate. Niettemin worden de vertalingen steeds beter en zijn er steeds meer taalcombinaties mogelijk. Dakzij experimenten met neurale netwerken kan je in de toekomst ook taalparen selecteren die de vertaalmachine zelf niet kent. Aangezien Google 103 talen verstaat, worden dat 5.253 taalparen.
[related_article id=”188166″]Aangezien Nederlands geen populaire of wijdverspreide taal is zoals het Engels, is dat goed nieuws voor ons. De onderzoekers van Google deden zelf de test met Koreaans naar Japans; een taalpaar dat de vertaalmachine nooit werd aangeleerd en de resultaten zijn verbluffend accuraat. Translate gebruikt daarvoor een gemeenschappelijke vertaaltaal (in dit geval Engels) om semantische verbanden te leggen en zo uit zichzelf de vertaling te doen slagen.Nederlands-Koreaans?
Google begreep in eerste instantie zelf niet goed hoe dat mogelijk was. Neurale netwerken zijn enorm complex en doen onderzoekers geregeld versteld staan. In dit geval bleek dat het neurale netwerk eigen ‘interlingua’ gebruikt: structuren die het zelf bedenkt om semantische verbanden te leggen en op te slaan; in plaats van letterlijk één-op-één zinnetjes te memoriseren om ze erna weer uit te spuwen.
De onderzoekers hebben op deze manier reeds twaalf talen in een database kunnen steken die even groot is als eentje die voordien slechts één taalpaar bevatte. Daarbij is er slechts een erg klein verlies aan kwaliteit te merken. Tegen dit tempo kunnen we binnenkort Nederlands vertalen naar zowat elke taal, zonder ons onsterfelijk belachelijk te maken.