OpenAI o1: Alt du trenger å vite om AI-en som resonnerer

OpenAI o1 er en modell som «tenker» og løser oppgaver steg for steg.

OpenAI o1

Sammendrag

  • o1 ble lansert 12. september 2024.
  • Den kan løse oppgaver innen vitenskap, koding og matematikk.
  • Modellen viser hvordan den tenker, steg for steg.
  • Dette er et skritt på veien mot automatiske AI-agenter.
  • Tjenesten mangler fortsatt noen funksjoner som ChatGPT har.

Hva er OpenAI o1?

OpenAI o1 er en samling med AI-modeller. De første modellene, o1-preview og -mini, ble lansert 12. september 2024.1 o1-preview

Alle med pluss-abonnement har fått tilgang til den nyeste versjonen. Du finner den i ChatGPT.

Det som skiller o1 fra tidligere modeller, er at den er laget for å resonnere og løse oppgaver innen vitenskap, koding og matematikk.2 OpenAI

OpenAI sier at modellen «bruker mer tid på å tenke før den svarer».3 o1-preview

Dette er en helt ny tilnærming til språkmodeller.

Se hvordan den tenker:

En ny olympisk mester?

Resultatene til den nye modellen er mildt sagt imponerende.

I en kvalifiseringstest for den internasjonale matematikkolympiaden (IMO) løste o1 83 % av oppgavene.4 Learning to Reason with LLMs

Dette er oppgaver som er så vanskelige at bare de flinkeste matematikkstudentene i verden klarer å løse dem.

Til sammenligning klarte GPT-4 bare 13 %.

Se hvordan den løser matteoppgaver:

I programmeringskonkurranser presterte o1 bedre enn 89 % av deltakerne.5 Learning to Reason with LLMs

OpenAI hevder også at teknologien er på nivå med PhD-studenter innen fysikk, kjemi og biologi.6 Learning to Reason with LLMs

Det mangler noen funksjoner

Tjenesten mangler foreløpig flere funksjoner sammenlignet med ChatGPT (GPT-4)…

Den mangler evnen til å surfe på nettet, samt analysere bilder og filer.

I tillegg jobber den mye saktere. Derfor er den bedre egnet for krevende, analytiske oppgaver.

Hvordan fungerer o1?

Tidligere modeller som GPT-4 ble trent til å gjenkjenne mønstre i tekst.

De bruker statistikk til å beregne det mest sannsynlige svaret.

Prøving og feiling

I motsetning løser o1 problemer gjennom såkalt forsterkende læring («reinforcement learning»).7 Learning to Reason with LLMs

Dette betyr at modellen lærer gjennom prøving og feiling, på samme måte som mennesker. Den blir belønnet når den løser problemer riktig og «straffet» når den gjør feil.

Med tiden lærer den å forbedre seg selv.

Den tenker steg for steg

o1 bruker en metode som kalles «chain-of-thought reasoning».8 Google-studie / ArXiv-studie

Med andre ord tenker den steg for steg.9 Learning to Reason with LLMs

Den viser frem tankene sine mens den jobber, slik at du kan følge resonnementet.

OpenAI o1 tenker steg for steg 1
Skjermbilde av tankegangen.

Hvis du gir o1 en matteoppgave, vil den ikke bare spytte ut et svar.

I stedet vil den vise deg hvordan den tenker seg frem til løsningen.

Dette er forsåvidt ikke noe nytt, siden Perplexity allerede gjør dette.

Perplexity Resonnerer
Bilde: Perplexity Pro jobber stegvis og strukturert for å løse en oppgave.

Et skritt på veien mot AI-agenter

Dagens språkmodeller er smarte, men ikke selvstendige. Du må fortelle de hva de skal gjøre.

Dette har forskere jobbet med å løse i flere år.

De utvikler såkalte «AI-agenter». Det vil si programmer som automatisk løser oppgaver på egen hånd. Litt som selvkjørende biler.

Det vi ser nå er de første konturene av disse selvstendige agentene.

Gi agenten et mål, også finner den løsningen selv. Gitt at den får nok tid.

Et konkret eksempel er Auto-GPT. Det er et program som bryter oppgaver ned i deloppgaver. Så bruker den GPT-4 for å løse hver deloppgave.10 Wikipedia: Auto-GPT

Med tiden vil agenter avlaste oss slik at vi kan fokusere på viktigere arbeidsoppgaver.

Hva betyr dette for deg?

Hvis du jobber i et felt som kan dra nytte av o1, vil jeg anbefale å begynne å eksperimentere med tjenesten.

Men selv om du ikke planlegger å bruke teknologien, er det viktig å være klar over hvor vi er på vei.

Fremover spår jeg at

  • «AI-literacy» blir en stadig viktigere ferdighet i arbeidslivet
  • vi får raskere vitenskapelige fremskritt
  • det forventes at alle bruker AI-assistenter og -agenter

Denne teknologien kommer til å endre mange industrier.

Det er bedre å være forberedt enn å bli tatt på sengen.

Skroll til toppen