Meta gaat AI alsnog trainen op data van Europese gebruikers

Meta wilde al langer gegevens van Europese gebruikers inzetten voor het trainen van zijn AI. Dat maakte het bedrijf vorig jaar bekend in berichten aan Facebook– en Instagram-gebruikers. Niet lang daarna zette Meta het plan in de ijskast na tussenkomst van de Ierse privacytoezichthouder (DPC). Nog geen jaar later wordt het plan alsnog hervat, meldt het bedrijf in een blogpost.
Alleen openbare gegevens
Gebruikers worden deze week geïnformeerd over Meta’s hernieuwde AI-plannen. Volgens het bedrijf gebeurt dit via meldingen in de apps en per e-mail, waarin staat uitgelegd hoe en welke data gebruikt zullen worden. Vast staat dat het gaat om publieke berichten die voor iedereen toegankelijk zijn – ook zonder Facebook- of Instagram-account. Naast reguliere berichten gebruikt Meta ook reacties voor het trainen van zijn AI.
In de berichten staat verder uitgelegd hoe mensen bezwaar kunnen maken. Dat kan rechtstreeks via een link in de melding. Van gebruikers die het bezwaarformulier insturen, zal Meta geen data verwerken voor zijn AI-systemen. Het bedrijf belooft bovendien dat alle verzoeken via dit formulier zullen worden ingewilligd. Het lijkt dus niet nodig een uitgebreide motivatie te geven om af te zien van datagebruik.
Gegevens van jongeren onder de 18 jaar worden bij voorbaat uitgesloten, evenals privéberichten aan vrienden en familie.
Waarom trainen op Europese data?
Meta stelt dat het gebruik van Europese data noodzakelijk is om zijn AI-systeem, Meta AI, beter af te stemmen op Europese gebruikers. Tot nu toe is de AI uitsluitend getraind op data van gebruikers buiten de EU, waardoor het systeem weinig tot geen kennis heeft van de nuances binnen Europese gemeenschappen. Ook ontbreekt het aan hyperlokale content uit specifieke regio’s, en aan begrip van hoe gebruikers in bepaalde landen omgaan met humor en sarcasme.
Hoe klein die verschillen ook zijn: ze hebben wel invloed op de antwoorden die een AI-systeem geeft. Hoe uitgebreider de kennis van een regio, hoe toepasselijker het antwoord zal zijn. Veel andere AI-ontwikkelaars gebruiken hiervoor data uit (openbare) webbronnen, maar Meta kiest ervoor data van zijn eigen gebruikers te benutten – wat bovendien aanzienlijk goedkoper is.
Hoewel de aanpak op kritiek stuit van privacyexperts, zou het Europese Comité voor gegevensbescherming (EDPB) inmiddels hebben ingestemd. “We zijn blij met het advies van de EDPB in december, waarin werd bevestigd dat onze oorspronkelijke aanpak voldeed aan onze wettelijke verplichtingen”, schrijft Meta.