ChatGPTs AI-stemme imponerer: Er «Her» her?

Nå kan ChatGPT synge og etterligne dialekter og dyr. AI-stemmen er blitt svært realistisk.

Hør ChatGPTs nye AI-stemme

Husker du «Her»?

Husker du «Her» fra 2013?

I filmen forelsker Joaquin Phoenix seg i en AI med en menneskelig stemme.

Hun har tilgang til dataene hans og hjelper ham gjennom livet.

Den gangen var det Sci-Fi.

Men nå virker det ikke så fjernt lenger.

ChatGPTs AI-stemme oppgraderes

Tidligere i år kom GPT-4o («omni»).1 OpenAI

Det var en stor oppgradering til ChatGPT, som demonstreres av OpenAI her:

Video: OpenAI demonstrerer ChatGPTs AI-stemme.

Ny stemme

Stemmefunksjonen ble oppgradert som en del av GPT-4o.2 OpenAI: Advanced Voice Mode

Den gamle stemmen var ikke så naturlig, og det var stivt å snakke med den. Man måtte blant annet vente lenge på svar.

Stemmen har fått flere funksjoner:

  • Den forstår følelser og tilpasser toneleie dynamisk.
  • Den snakker i sanntid (ingen lange pauser).
  • Du kan avbryte den.
  • AI-en kan forutsi hva du vil si.
  • Stemmen kan synge og etterligne dialekter.

Nå ruller OpenAI ut stemmen stegvis, for å teste den.3 OpenAI (X)

Det vil si at bare noen brukere har fått tilgang. Flere har delt opplevelsene sine på sosiale medier (se under).

Hør stemmen

En bruker på YouTube har gjort en rekke tester hvor han ber AI-en justere stemmen sin.

Se videoene under.

Stemmen etterligner dialekter

I denne videoen testes lyder, toneleie, hastighet, dialekter og mye mer.

Video: ChatGPT kan etterligne amerikanske og britiske aksenter.

Stemmen etterligner dyrelyder

I denne videoen etterligner ChatGPT høner, katter og så videre.

Video: ChatGPT kan etterligne dyr.

Hva kan dette brukes til?

Å lære nye språk

Her viser OpenAI hvordan man kan lære nye språk med ChatGPT:

Video: Lær portugisisk med AI.

Bedre kundeservice

Bedrifter vil kunne tilby døgnåpen servicetelefon med AI.

Det skal sies at man må kvalitetssikre dette nøye. Tidligere har folk lurt en AI til å selge en ny Chevrolet til 11 kroner.

Samtidig må vi tenke på arbeidsplasser. Hva skjer når serviceyrket automatiseres?

Å hjelpe de med nedsatt funksjonsevne

Personer med synsnedsettelser kan få assistanse.

OpenAI demonstrerer hvordan det fungerer:

I film og TV

AI-stemmer gir filmskapere og TV-produsenter nye verktøy. De kan:

  • Dubbe innhold raskere og billigere
  • Lage stemmer til animerte skuespillere
  • Fikse feil uten å spille inn scenen på nytt

Å lese opp lydbøker

Lydbøker vil få nytt liv med AI-stemmer.

Forfattere og produsenter kan finne stemmene som passer best.

Det blir ikke bare en person som leser opp hele boken. Hver karakter kan ha sin egen stemme.

Hva kan gå galt med stemmeteknologien?

Etikk og opphavsrett: Hamsuns stemme

Nå har et forlag som heter Storytel laget en ny versjon av «Sult» som lydbok. De har brukt AI til å etterligne Knut Hamsuns stemme.

De trente AI med gamle opptak av Hamsun. Så lot de stemmen lese opp boken.

Hamsuns barnebarn har vært svært kritiske til dette.

De sier det er groteskt at Storytel bruker bestefarens stemme på denne måten.

«Vi finner det utrolig smakløst å lage en AI-generert stemme av vår bestefar»

– Regine Hamsun4 VG

Storytel sier at de har lov til å gjøre dette fordi Hamsun døde for over 70 år siden. I Norge blir bøker og andre verk «frie» 70 år etter at forfatteren dør.5 NRK

Svindlere

Svindlere kan bruke AI til å etterligne stemmen til noen du kjenner.

De kan ringe deg og spør om penger.

Kanskje stemmen sier at vedkommende har mistet telefonen og lommeboken.

Det kan høres overbevisende ut i øyeblikket.

Nå må vi altså være mer på vakt.

Skroll til toppen