OpenAI houdt AI-detectietool voor tekst achter de hand
Dat OpenAI een AI-detectietool ontwikkelde, werd dit weekend door The Wall Street Journal naar buiten gebracht. Kort na het verschijnen van dat artikel, updatete OpenAI een oude blogpost, die origineel in mei verscheen. Daar staat te lezen dat het team een manier heeft ontwikkeld om tekst te watermarken, maar dat ze die voorlopig nog niet in gebruik nemen. In de blogpost gaat OpenAI verder in op de redenen daarvoor.
Onderzoek loopt nog
Eerst en vooral: het onderzoek naar die tekstuele watermerken loopt nog. Er moet dus nog flink aan gesleuteld worden, en dat komt vooral omdat die watermerken relatief makkelijk te misbruiken zijn. In alledaagse situaties hebben de watermerken volgens OpenAI hun nut al bewezen, maar het blijkt nog steeds makkelijk om AI-detectietools om de tuin te leiden. Dat kan al door de tekst door een vertaalmachine te halen, of door die opnieuw te laten verwoorden door een ander AI-systeem.
Buiten ChatGPT om kan dat watermerk dus omzeild worden. OpenAI laat weten dat het watermerk ook omzeild kan worden binnen ChatGPT. Daarvoor laat je een tekst schrijven, maar laat je ChatGPT speciale karakters in de tekst zetten. Nadien hoef je alleen te vragen om die te verwijderen, en het watermerk verschijnt niet in de tekst.
OpenAI weegt momenteel de baten en de risico’s af. Als dat tekstuele watermerk zo makkelijk omzeild kan worden, zou het gebruikers een vals idee over de authenticiteit kunnen geven. Het AI-bedrijf stipt ook aan dat zo’n watermerk een stigmatiserende werking kan hebben: personen die niet vlot Engels schrijven, zouden ermee door de mand vallen.
Video krijgt prioriteit
Het bedrijf hanteert naar eigen zeggen een “doordachte aanpak” voor de uitrol van dat tekstuele watermerk. Het kan daardoor nog wel even duren voor die AI-detectietool verschijnt. De prioriteit ligt bovendien bij authenticatietools voor audiovisuele content. Ook filmpjes met beeld en geluid kan je namelijk maken met GPT, en OpenAI wil eerst daar niet-authentieke beelden gaan markeren. Hoelang het duurt voor dat detectiesysteem live gaat, is niet duidelijk.