AI-model DeepSeek blijkt kostelijker dan gedacht

Als er de afgelopen weken een AI-bedrijf was dat met de aandacht ging lopen, dan was dat DeepSeek. De Chinese firma ontwikkelde het R1-taalmodel, dat gebruikt wordt om een ChatGPT-achtige AI-toepassing aan te drijven. Opvallend, want Chinese bedrijven hebben al lange tijd geen toegang meer tot processors met Amerikaanse technologie. Die worden noodzakelijk geacht voor de AI-ontwikkeling. Dat het Chinese bedrijf er toch in slaagde om een taalmodel te trainen, krijgt daarom heel wat aandacht.
Dat is niet het enige waarvoor DeepSeek aandacht kreeg. Ook het prijskaartje dat aan de AI-toepassing hing, viel op z’n minst indrukwekkend te noemen. Bedrijven zoals Google, Meta en OpenAI spenderen miljarden om hun AI-toepassingen te trainen. DeepSeek zou aan het R1-model slechts 6 miljoen dollar gespendeerd hebben. Aan die claim werd getwijfeld. Terecht, zo blijkt: SemiAnalysis becijferde dat die 6 miljoen dollar maar een deel van de ontwikkeling betaalt.
Materiaal, personeel en R&D
De 6 miljoen dollar die DeepSeek als kost noemt, heeft enkel betrekking tot de GPU-kosten voor de pretraining. Materiaal- en personeelskosten, of zelfs R&D-kosten neemt DeepSeek niet mee in het kostenplaatje. Onterecht dus, want ook dat geld werd uitgegeven. Die kosten zouden bovendien flink zijn opgelopen: DeepSeek gebruikte namelijk Nvidia H100-GPU’s om het AI-model te trainen. Zowat elk AI-bedrijf wil die GPU’s om AI-toepassingen te trainen. De vraag ernaar is erg hoog en de prijsstelling navenant.
Alles in rekening genomen zou DeepSeek zo’n 1,6 miljard dollar besteed hebben aan de ontwikkeling van het AI-systeem. Hoewel DeepSeeks R1-model wel efficiënt en performant is, is het dus lang niet zo goedkoop als het bedrijf eerst deed geloven. Daardoor is het AI-systeem minder revolutionair dan eerst gedacht.
Ook op andere vlakken is het Chinese AI-systeem niet bijzonder revolutionair. Het taalmodel houdt bijvoorbeeld vast aan Chinese censuurregels en weigert antwoord te geven op vragen die gevoelig kunnen liggen. Ook op vlak van veiligheid scoorde het AI-systeem geen al te beste punten. Databases waarin gesprekken van gebruikers opgeslagen werden, waren een tijdlang vrij beschikbaar via het internet.