OpenAI o1: Alt du trenger å vite om AI-en som resonnerer

Sammendrag

o1 ble lansert 12. september 2024.
Den kan løse oppgaver innen vitenskap, koding og matematikk.
Modellen viser hvordan den tenker, steg for steg.
Dette er et skritt på veien mot automatiske AI-agenter.
Tjenesten mangler fortsatt noen funksjoner som ChatGPT har.

Hva er OpenAI o1?

OpenAI o1 er en samling med AI-modeller. De første modellene, o1-preview og -mini, ble lansert 12. september 2024.¹

Alle med pluss-abonnement har fått tilgang til den nyeste versjonen. Du finner den i ChatGPT.

Det som skiller o1 fra tidligere modeller, er at den er laget for å resonnere og løse oppgaver innen vitenskap, koding og matematikk.²

OpenAI sier at modellen «bruker mer tid på å tenke før den svarer».³

Dette er en helt ny tilnærming til språkmodeller.

Se hvordan den tenker:

Guide: Slik kommer du i gang med ChatGPT

En ny olympisk mester?

Resultatene til den nye modellen er mildt sagt imponerende.

I en kvalifiseringstest for den internasjonale matematikkolympiaden (IMO) løste o1 83 % av oppgavene.⁴

Dette er oppgaver som er så vanskelige at bare de flinkeste matematikkstudentene i verden klarer å løse dem.

Til sammenligning klarte GPT-4 bare 13 %.

Se hvordan den løser matteoppgaver:

I programmeringskonkurranser presterte o1 bedre enn 89 % av deltakerne.⁵

OpenAI hevder også at teknologien er på nivå med PhD-studenter innen fysikk, kjemi og biologi.⁶

Det mangler noen funksjoner

Tjenesten mangler foreløpig flere funksjoner sammenlignet med ChatGPT (GPT-4)…

VIS MER

Hvordan fungerer o1?

Tidligere modeller som GPT-4 ble trent til å gjenkjenne mønstre i tekst.

De bruker statistikk til å beregne det mest sannsynlige svaret.

Prøving og feiling

I motsetning løser o1 problemer gjennom såkalt forsterkende læring («reinforcement learning»).⁷

Dette betyr at modellen lærer gjennom prøving og feiling, på samme måte som mennesker. Den blir belønnet når den løser problemer riktig og «straffet» når den gjør feil.

Med tiden lærer den å forbedre seg selv.

Den tenker steg for steg

o1 bruker en metode som kalles «chain-of-thought reasoning».⁸

Med andre ord tenker den steg for steg.⁹

Den viser frem tankene sine mens den jobber, slik at du kan følge resonnementet.

OpenAI o1 tenker steg for steg 1 — Skjermbilde av tankegangen.

Hvis du gir o1 en matteoppgave, vil den ikke bare spytte ut et svar.

I stedet vil den vise deg hvordan den tenker seg frem til løsningen.

Dette er forsåvidt ikke noe nytt, siden Perplexity allerede gjør dette.

Perplexity Resonnerer — Bilde: Perplexity Pro jobber stegvis og strukturert for å løse en oppgave.

Et skritt på veien mot AI-agenter

Dagens språkmodeller er smarte, men ikke selvstendige. Du må fortelle de hva de skal gjøre.

Dette har forskere jobbet med å løse i flere år.

De utvikler såkalte «AI-agenter». Det vil si programmer som automatisk løser oppgaver på egen hånd. Litt som selvkjørende biler.

Det vi ser nå er de første konturene av disse selvstendige agentene.

Gi agenten et mål, også finner den løsningen selv. Gitt at den får nok tid.

Et konkret eksempel er Auto-GPT. Det er et program som bryter oppgaver ned i deloppgaver. Så bruker den GPT-4 for å løse hver deloppgave.¹⁰

Med tiden vil agenter avlaste oss slik at vi kan fokusere på viktigere arbeidsoppgaver.

Hva betyr dette for deg?

Hvis du jobber i et felt som kan dra nytte av o1, vil jeg anbefale å begynne å eksperimentere med tjenesten.

Men selv om du ikke planlegger å bruke teknologien, er det viktig å være klar over hvor vi er på vei.

Fremover spår jeg at

«AI-literacy» blir en stadig viktigere ferdighet i arbeidslivet
vi får raskere vitenskapelige fremskritt
det forventes at alle bruker AI-assistenter og -agenter

Denne teknologien kommer til å endre mange industrier.

Det er bedre å være forberedt enn å bli tatt på sengen.

Sammendrag