Schrijfstijl verraadt je online identiteit
Je kan verschillende methodes toepassen om anoniem op het internet te vertoeven. Zo kan je een VPN-dienst gebruiken om je IP-adres te maskeren, nergens aanmelden en publieke hotspots gebruiken. Wetenschappers van de Universiteit van Sofia (Bulgarije) menen echter dat je schrijfstijl je nog steeds verraadt. Daarom hebben de onderzoekers een algoritme bedacht dat je teksten middelmatig maakt.
Schrijfstijl
Iedereen heeft zijn eigen schrijfstijl, die verraadt wie je bent. Vanaf het moment dat je een tekst online plaatst, kan iemand hierdoor je identiteit achterhalen, hoeveel privacytechnieken je ook toepast. “Wanneer je iets plaats op een forum is je anonimiteit nog steeds in gevaar, aangezien het mogelijk is om je posts te analyseren en te matchen met deze van een gekende gebruiker,” staat te lezen in de paper van de wetenschappers. “Om de identiteit van een persoon te achterhalen moet je een idee hebben van wie hat kan zijn en voldoende voorbeeldteksten hebben van deze persoon.”
De identiteit van iemand achterhalen aan de hand van zijn schrijfstijl is een beproefde methode. Je kan de techniek gebruik om iemand te betrappen op plagiaat of om de auteur van een historische tekst te achterhalen. In een tijd waarin iedereen minstens een paar zinnen online heeft staan, kan de methode eveneens gebruikt worden door overheden en cybercriminelen om je doen en laten te volgen. De Bulgaarse wetenschappers zijn daarom van mening dat we onze teksten moeten depersonaliseren.
Transformaties
De onderzoekers stelden zichzelf drie doelen. De getransformeerde tekst moet veilig zijn; je mag niet in staat zijn om de oorspronkelijke auteur van de tekst te achterhalen. Verder moet de aangepaste tekst dezelfde betekenis hebben als de originele tekst. Ook vinden de onderzoekers dat de tekst er niet verdacht mag uitzien. De tekst moet nog steeds logisch opgebouwd zijn en van een echte persoon afkomstig kunnen zijn.
Het algoritme dat de wetenschappers gebruiken, vervangt de korte vormen in zinnen door hun volledig vorm. I’m wordt bijvoorbeeld vervangen door I am. Verder worden getallen voluit geschreven en worden symbolen eveneens vervangen door woorden. % wordt bijvoorbeeld percentage. Ten slotte worden zinsconstructies met bezittelijke voornaamwoorden ingekort. Het boek van Jan verandert in Jans boek.
De transformaties moeten ervoor zorgen dat je tekst middelmatiger is, waardoor hij harder lijkt op deze van andere personen. Volgens de wetenschappers zou je identiteit achterhaald kunnen worden aan de hand van de tekst “I am proud. Though I carry my love with me to the tomb, he shall never, never know it”. “I’m proud of them; and though I carry my beloved with me to the tomb he shall ever ever know it” zou je daarentegen in alle anonimiteit kunnen posten.
Middelmatigheid
Het algoritme van de Bulgaren is puur voor wetenschappelijke doeleinden, maar toont wel aan wat je zelf kan doen op het internet om anoniem te blijven. Door je gemiddeld te gedragen, wordt het moeilijker voor hackers om je identiteit van anderen te onderscheiden. Wie bekend staat om zijn unieke schrijfwijze, laat een erg duidelijk spoor achter op het internet.