Claude 3.5 Sonnet (Anthropic) klopt GPT-4o in benchmarks
Anthropic kwam donderdag met een grote update van zijn chatbot. Claude 3.5 Sonnet is niet alleen krachtiger dan zijn voorganger, maar ook twee keer zo snel. Het kan wedijveren met GPT-4o van OpenAI en klopt de grote concurrent zelfs in een aantal benchmarks die Anthropic publiceerde. Daaruit blijkt ook hoe dicht de grote concurrenten tegen elkaar aanleunen: ook Gemini (Google) en Llama scoren maar op enkele procentpunten van de rest.
Sonnet is de eerste release onder de Claude 3.5-noemer en is ontworpen om het meest gebalanceerde Anthropic-model te zijn. Als het op pure snelheid aankomt is Claude 3.5 Haiku de koploper, terwijl Claude 3.5 Opus (dat later dit jaar verschijnt) het meest krachtige taalmodel zou worden. De Sonnet-update komt er al enkele maanden na de release van de Claude 3-familie. Het toont aan tegen welk tempo AI-ontwikkelaars hun nieuwste toepassingen uitrollen.
Claude 3.5 Sonnet: slimmer taalmodel
Volgens Anthropic zorgt Claude 3.5 Sonnet voor een stap voorwaarts als het gaat over het begrijpen van nuance, humor en complexere prompts. De chatbot zou ook in een natuurlijkere, meer menselijke toon kunnen schrijven. Uit de benchmarks blijkt dat het nieuwe model oude records verbreekt als het gaat over redeneringsvermogen, kennis en vaardigheid in programmeren. Bovendien zou Claude 3.5 Sonnet ook beter zijn dan Claude 3.0 Opus in het interpreteren van visuele input: Anthropic zegt dat het nieuwe model “heel accuraat tekst kan transcriberen op basis van imperfecte beelden”. Dat is een skill waarmee de AI-bouwer heel wat klanten voor zich wil winnen in de retail, logistiek en financiële sector. De bot kan voor hen data halen uit tabellen, grafieken en andere visuele weergaven.
Verder bevat de update voor Claude nog een nieuwe workspace: Artifacts. Als je de chatbot vraagt om content te genereren, zoals programmeercode, tekstdocumenten of webdesigns, dan zal die een apart venster openen vanuit de chat. Vandaaruit zal je Claude de opdracht kunnen geven om aanpassingen te doen. In het Artifacts-venster kan je steeds de geüpdatete input volgen. De nieuwe workspace moet volgens Anthropic de weg vrijmaken voor AI in samenwerkingsprojecten. “In de nabije toekomst zullen professionelen hun kennis, documenten en lopende projecten kunnen centraliseren op één plek. Claude kan dan dienstdoen als een on-demand teamgenoot”, zegt de ontwikkelaar in zijn aankondiging.
Claude 3.5 sonnet is nu vrij beschikbaar voor elke gebruiker die een account registreert op de website en via de Claude-app voor iOS. Je kan er vandaag al mee aan de slag.