Nieuws

Google lanceert taalmodel Gemini waarmee het OpenAI wil overtreffen

Gemini
© Google
Google hinkt al een jaar achterop in de AI-race. Met het nieuwe taalmodel, Gemini, wil het terug aan de kop gaan rijden.

Gaat het over artificiële intelligentie? Dan gaat het al een jaar om ChatGPT, Bing of Copilot en pas dan over Bard. De AI-chatbot van Google wordt bekeken alsof hij minder goed is. Met het nieuwe multimodale taalmodel Gemini laat Google zien dat er afgelopen jaar flink gewerkt is achter de schermen.

Aanvankelijk was de Google-chatbot, die we ondertussen kennen als Bard, niet beschikbaar in Europa. Terwijl gebruikers in Amerika al konden kiezen tussen OpenAI’s ChatGPT, Microsofts Bing en Copilot en Googles Bard, was de keuze in Europa beperkt tot de op GPT gebaseerde modellen van OpenAI en Microsoft. In de begindagen konden de verschillende modellen nog met elkaar concurreren, maar nadat OpenAI een upgrade naar het GPT-4-taalmodel uitvoerde was de race voor Google verloren. Bard werd dan wel wegwijs gemaakt in je e-mails, Google Workspace-documenten en YouTube-video’s, uiteindelijk bleek ChatGPT toch het krachtigste én meest populaire taalmodel.

Daar probeert Google met Gemini een stokje voor te steken. Google voerde meteen een vergelijkende test uit: in 30 van de 32 tests die het bedrijf uitvoerde kwam Gemini aan de top te liggen. Het nieuwe taalmodel lijkt dus al een succes te zijn.

Tekst én beeld

Om het nieuwe taalmodel zoveel beter te maken, gebruikt Google in feite dezelfde trucs als OpenAI. Gemini is, net als GPT-4, een multimodaal taalmodel. Dat wil zeggen dat het taalmodel niet alleen getraind werd op tekst, maar ook op andere soorten data. Voor Google gaat het dan over afbeeldingen, video en verschillende programmeertalen. Dat zorgt ervoor dat het taalmodel ook met stilstaande en bewegende beelden overweg kan en dat het AI-systeem zelfs kan programmeren. Om het met de woorden van Deepmind-CEO Demis Hassabis te zeggen: “Gemini kan de wereld rondom ons begrijpen zoals wij dat doen”.

Het systeem kan dan ook verschillende soorten input verwerken. Of je het taalmodel nu flarden code, tekst, videobeelden of foto’s serveert: op alles zou het een antwoord klaar moeten hebben. Google-CEO Sunder Pichai geeft aan dat de technologie alle Google-producten zal gaan verbeteren. Of je nu je Gmail-inbox aan het opruimen bent, spreadsheets maakt via Google Sheets of je bestanden probeert te beheren in Google Drive: overal zal Gemini je kunnen helpen.

Drie modellen

De eerste versie van het nieuwe taalmodel wordt in drie versies uitgebracht. Momenteel heeft Google al Gemini Pro en Gemini Nano in aanbieding, terwijl Gemini Ultra vanaf volgend jaar beschikbaar moet zijn.

Gemini Pro

Gebruikers kunnen meteen aan de slag met Gemini Pro: dat taalmodel zal namelijk de Bard-chatbot gaan aandrijven. Bard zou daardoor beter kunnen samenvatten, redeneren en schrijven. Met andere woorden: het wordt een betere assistent. Het taalmodel is wel enkel beschikbaar in het Engels. Spreek je in het Nederlands tegen de chatbot? Dan zal hij voorlopig terugvallen op het PaLM 2-taalmodel. Later zou Bard ook in andere talen Gemini gaan gebruiken.

Gemini Nano

Google biedt ook ‘Gemini Nano’ aan, een verkleinde versie van het taalmodel die ook op je smartphone moet werken. Dat taalmodel komt aanvankelijk enkel naar de Pixel 8 Pro, waar gebruikers toegang krijgen tot een aantal unieke functies. Het AI-systeem zal bijvoorbeeld spraakopnames kunnen samenvatten en helpt je bij het bedenken van gepaste antwoorden in WhatsApp-chats. Op termijn moet het AI-systeem ook naar andere Android-smartphones komen én moet Gemini Nano met meerdere apps kunnen werken. Bovendien zullen ontwikkelaars AI-toepassingen kunnen bouwen voor smartphones die AI-functies ondersteunen. Wanneer we de eerste van deze AI-toepassingen mogen verwachten is echter maar de vraag.

Gemini Ultra

Tot slot laat Google ook Gemini Ultra zien, al is dat taalmodel pas volgend beschikbaar. Het gaat om de meest geavanceerde versie van het taalmodel. Momenteel is die beschikbaar voor een klein aantal klanten, partners en ontwikkelaars. Eenmaal het model helemaal op punt staat, wat in begin 2024 het geval zou moeten zijn, krijgen zakelijke klanten en ontwikkelaars toegang tot Gemini Ultra. Zij zullen dan ook kunnen spreken met een nieuwe chatbot: ‘Bard Advanced’.

Beter dan ChatGPT?

Google maakt zich sterk dat het nieuwe taalmodel sterker is dan dat van OpenAI. Die bewering klopt deels: Gemini laat betere cijfers zien dan zowel GPT-3.5 als PaLM 2, het taalmodel dat Google hiervoor gebruikte. De resultaten liggen anders wanneer de vergelijking met het meest recente GPT-4-taalmodel gemaakt wordt. Gemini Pro, de versie van het taalmodel waar meeste gebruikers mee aan de slag kunnen, scoort op sommige tests slechter dan GPT-4. Enkel Gemini Ultra, de versie die volgend jaar voor zakelijke klanten beschikbaar wordt, weet in meeste gevallen GPT-4 te overtreffen.

Toch lijkt de nieuwe Bard krachtiger te zijn dan ChatGPT. De gratis versie van OpenAI’s chatbot draait namelijk nog steeds op GPT-3.5. Dat taalmodel wordt overtroefd door Gemini Pro, waar je via Bard mee aan de slag zal kunnen. Wie een ChatGPT Plus-abonnement heeft, en dus toegang heeft tot GPT-4, zal pas vanaf volgend jaar met een krachtiger AI-systeem kunnen converseren.

aibusinessChatGPTgeminigooglegoogle workspaceLLMOpenAI

Gerelateerde artikelen

Volg ons

Het is Black Friday bij bol.com!

Het is Black Friday bij bol.com!

Deals scoren