OpenAI rolt geavanceerde Voice Mode uit
In de aankondiging op X gaf OpenAI ook een woordje uitleg. “Voice Mode biedt een meer natuurlijke manier van converseren, in real time. Je kan het gesprek op elk moment onderbreken. ChatGPT zal je emoties kunnen detecteren en erop reageren”, klinkt het veelbelovend.
Er is sinds september vorig jaar al de mogelijkheid om opdrachten met je stem te geven, maar een echt gesprek voeren met ChatGPT ging nog niet zo vlotjes. ChatGPT-4o schakelt een versnelling hoger. Het nieuwste taalmodel gebruik één enkel multimodaal taalmodel voor de stemmogelijkheden, terwijl de vorige audiomodule nog drie verschillende modellen combineerde. Nu ligt de latency een stuk lager en zouden gesprekken dus vloeiender moeten verlopen.
Voice Mode uitgesteld
In mei haalde OpenAI zich nog de woede op de hals van het management van Scarlett Johansson. De stemoptie die het toen demonstreerde, leek verdacht veel op die van de roodharige actrice. Toevallig of niet, want Johansson kroop al eens in de rol van een pratende AI, in de film Her. Daarop besloot OpenAI om de Voice Mode in de koelkast te stoppen, tot nu.
Hoe de stem precies klinken zal, is voorlopig nog niet duidelijk. Tegen het najaar moeten alle ChatGPT Plus-leden met de bot kunnen babbelen.