Geef je sms’jes aan de wetenschap
Gentse en Leuvense taalonderzoekers zoeken 200.000 sms"jes. “Afkortingen, dialect of pikante praat: het mag allemaal.”
Onderzoekers van de Hogeschool Gent en de KULeuven verzamelen al jaren geschreven woorden – de teller staat op 500 miljoen. “We hebben teksten gehaald uit vonnissen, handleidingen, kranten en boeken”, zegt Veronique Hoste van de Hogeschool Gent, “maar ook sociaalnetwerksites, blogs en sms"jes hebben een grote invloed. Teksten van websites kunnen we zelf verzamelen, maar voor sms"en hebben we de hulp van de schrijvers nodig.”
De onderzoekers willen tegen eind november minstens 200.000 berichten verzamelen. “Deelnemers hoeven zich geen zorgen te maken over hun privacy. We zijn niet geïnteresseerd in de inhoud. De berichten worden anoniem gemaakt en op een hoop gegooid.”
Via de verzameling stellen ze modellen op voor technologische toepassingen. “Daarmee kun je bijvoorbeeld een sms omzetten naar standaardtaal die een spraakcomputer kan voorlezen. Vandaag krijg je door alle afkortingen en dialectwoorden nog onbegrijpelijk gebrabbel.”
“Heel wat mensen zeggen op Facebook of Twitter wat ze vinden van een bepaald product. Dat is vandaag niet te verwerken, maar met onze taaltechnologie zou je automatisch alle commentaren over pakweg de nieuwe iPhone kunnen verzamelen.”