21 oktober 2024 10:13

Meta’s nieuwe AI-model moet menselijke controle overbodig maken

Meta wil de manier waarop AI-modellen getraind worden ingrijpend veranderen. Controle door AI moet de menselijke toets vervangen.

AI-chatbots zoals ChatGPT en Gemini kunnen bijzonder handig zijn, maar je moet wel opletten als je ze gebruikt. Iedereen weet dat AI-programma’s soms zaken kunnen verzinnen en het niet altijd bij het rechte eind hebben. Het is dus belangrijk dat je de resultaten steeds goed controleert. Niet als het aan Meta ligt. Het moederbedrijf van Facebook, Instagram en WhatsApp wil ook die taak aan AI uitbesteden.

Meta praat al langer over de tool, maar bracht hem vorige week vrijdag uiteindelijk uit. De “Self-Taught Evaluator” is een tool die moet helpen om de AI-modellen van de toekomst te ontwikkelen. Momenteel gebeurt dat nog met menselijke tussenkomst, in een proces dat ‘Reinforcement Learning from Human Feedback’ heet, kortweg RLHF. De evaluatortool van Meta moet ervoor zorgen dat de mens er tussenuit kan, en dat AI het controlewerk kan overnemen.

Hoe dat momenteel gebeurt is namelijk bijzonder inefficiënt. Zoals in het echte leven moeten de chatbots vragen beantwoorden, maar mensen controleren de antwoorden dan. Zij moeten kijken of alle data correct gelabeld is, en daar is vrij specifieke kennis voor nodig. Bovendien moeten zij ook het antwoord op de vraag controleren. Meestal gaat dat om complexe vragen en ingewikkelde wiskunde.

Die controle zou de nieuwe Self-Taught Evaluator op zich moeten nemen. Daarvoor redeneert het model in stappen. Elk probleem deelt het op in kleinere deelproblemen, en zo probeert het ingewikkelde vraagstukken te versimpelen. De bedoeling is om met behulp van het evaluatormodel een AI-systeem in elkaar te zetten dat zelflerend is. Dat betekent dat het systeem zal kunnen leren van fouten. Dat moet helpen om AI beter en slimmer te maken dan de mens, zegt Jason Weston tegen Reuters. De onderzoeker, die het model hielp ontwikkelen, meent dat “zelflerend zijn en de mogelijkheid om zichzelf te evalueren cruciaal zijn” om AI te ontwikkelen die beter is dan de mens.

Meta is niet het eerste bedrijf dat de H in RLHF vervangt met AI. Wel is Meta het eerste bedrijf dat zo’n model publiceert. Google en Anthropic houden zich ook bezig met zelflerende AI-systemen, maar delen de vruchten van dat onderzoek vooralsnog niet.

Uitgelicht artikel

Zuckerberg: “Nog enkele jaren” voordat Meta AI geld oplevert

Schrijf je in op onze nieuwsbrief en ontvang elke werkdag het beste uit de techwereld in je mailbox.

ai meta

Arthur De Graef

Arthur is gepassioneerd door muziek, films en games en linuxgebruiker in zijn vrije tijd. Volgens hem zit achter alles, ook de nieuwste technologie, een verhaal dat hij met plezier uitpluist.