Alt om Claude 3: Chatboten som knuser ChatGPT

Sammendrag

Claude 3 er en samling med tre språkmodeller.
Flere tester og undersøkelser viser at Claude 3.5 Sonnet slår ChatGPT.
Sonnet ligger på andreplass i språkmodell-topplisten.
Personvern: Claude trenes ikke opp med dine data.

Hva er Claude 3?

Claude 3 er en samling med tre språkmodeller som er utviklet av Anthropic.

Modellene ble lansert 4. mars 2024, og de heter Haiku, Sonnet og Opus.¹

Haiku er den raskeste modellen, og er billig i bruk.
Sonnet er en balansert mellomting.
Opus er den mest intelligente, men tregeste varianten.

Disse modellene har flere fordeler over ChatGPT som jeg skriver om lengre ned i artikkelen.

Oppdatering 21.06.24 💡

Claude 3.5 Sonnet er lansert. Den er gratis og Anthropic sier den er mer intelligent enn Opus. Se sammenligningen under. ²

Her ser du en sammenligning av modellene:

Claude 3.5 Sonnet vs Haiku og Opus — Bilde: Anthropic

Modellene har stor kapasitet, og kan forholde seg til 150 000 ord av gangen. ChatGPT takler ca. 100 000 ord.³

Opus-modellen har scoret bedre enn ChatGPT på en rekke standardiserte tester.

Fortsett å lese for å finne ut hva fordelene er.

Om Anthropic (selskapet som utvikler Claude)

Anthropic ble grunnlagt i 2021 av OpenAI-forskere. De har som mål å skape AI-systemer som er trygge, ærlige og nyttige… ⁴

VIS MER

«Vi trener ikke [AI] med brukerdata med mindre brukeren gir oss eksplisitt tillatelse.»
– Anthropic⁸

Claude ble tilgjengelig i Norge 14. mai 2024.⁹

Video av Claude 3.5 Sonnet

Her er en video som viser hvordan Claude kan brukes til å gjøre om bilder og tall til grafer.

Saken fortsetter under.

Video: Claude 3.5 Sonnet vision.

Slik får du tilgang til Claude 3

Du kan bruke Claude på to måter: via Claude eller via Perplexity.¹⁰

Claude har en iOS og Android-app. Perplexity har en app for iOS og Android.

Slik får du tilgang til Claude (web og app)

Nettsiden:

Gå til Claude.ai.
Lag en konto
Abonner hvis du vil ha tilgang til de beste modellene.

Registrering på web med Claude — Bilde: Her registrerer du deg på web.

App (iOS eller Android):

Gå til App Store eller Google Play.
Last ned appen og lag en konto.
Abonner hvis du vil ha tilgang til de beste modellene.

Slik får du tilgang via Perplexity (web og app)

Perplexity er en AI-søkemotor kombinert med flere språkmodeller.

Du kan selv velge hvilke språkmodeller du vil bruke. Du kan velge mellom ChatGPT, Claude, Gemini og Mistral.

Perplexity har også tre bildegeneratorer: DALL-E 3, SDXL og Playground.

Gå til Perplexity.ai, Google Store eller Apple Store.
Lag en konto og abonner på Pro (20 dollar per måned).
Gå til innstillingene og velg Claude 3 Opus under «AI Model».

Perplexity Pro - Claude 3 — Bilde: Perplexity Pro lar deg velge språkmodeller.

Claude 3 sammenlignet med ChatGPT

Mine erfaringer med Claude Opus

Opus briljerer på det en språkmodell skal være god på: språk.

Claude Opus slår ChatGPT på tre ting:

Den forstår spørsmålene og instruksene bedre.
Den er mye bedre på norsk.
Den svarer ikke like stivt og svulstig som ChatGPT.

Du får også tilgang til det nyttige nettsøket i Perplexity Pro. Pro-søket finner raskt kilder som fôres inn i språkmodellen.

Dette søket er betraktelig raskere enn sneglefarten til Bing i ChatGPT.

I mine tester har det ført til færre hallusinasjoner og mer nøyaktige svar.

Men, Opus har noen svakheter:

Den har ikke like mange funksjoner som ChatGPT.

For eksempel: GPT-er, GPT-butikk og plugins.

Den kan heller ikke redigere videoer og lydklipp, slik som ChatGPT kan. Du kan ikke ha stemmesamtaler med den.

Utover det er ikke hukommelsen til Claude like bra når jeg har testet den. Altså, den kan glemme det vi har snakket om tidligere i samtalen.

Noen brukere mistenker at Perplexity har begrenset hukommelsen til AI-en (mindre kontekstvindu).¹¹

Bedre hukommelse krever mer datakraft, og det kan hende Perplexity prøver å spare penger på å redusere minnet. Dette er for øyeblikket et ubekreftet rykte.

Sonnet er i topplisten over språkmodeller

LMSYS Chatbot Arena er en nettside som rangerer språkmodeller etter ytelse.¹²

Systemet bruker Elo-rating, som i sjakk.

Slik fungerer det:

En bruker snakker med to chatboter samtidig og velger hvilken av de som gir best svar.
Når brukeren har valgt det beste svaret, får vinneren poeng.
De beste chatbotene vinner ofte og plasseres i toppen av listen.

Resultater:

Per 24.07.2024 ligger Sonnet 3.5 på tredjeplass.

LMSYS Chatbot Arena Leaderboard 24. juli 2024 — Skjermbilde av LMSYS Chatbot Arena (språkmodell-topplisten).¹³

Standardiserte tester

Det finnes en rekke standardiserte tester for å vurdere språkmodeller. Testene går på språkforståelse, allmennkunnskap, matematikk, resonnering, koding og så videre.

Som du kan se på bildet under, ligger Anthropics modeller i toppsjiktet:

Claude 3.5 Sonnet vs. Claude GPT 4 Gemini 1.5 Llama — Bilde: Anthropic.

Modellens minne (kontekstvinduet)

Kontekstvinduet forteller oss hvor mye informasjon en chatbot kan huske i en samtale. Minnet måles i «tokens».

Opus har 200 000 tokens. ChatGPT har 128 000 tokens.¹⁴

200 000 tokens tilsvarer omtrent 150 000 ord, eller 500 sider.

Med et så stort kontekstvindu kan AI-modellen håndtere store kodebaser, rapporter og bøker.

Claude 3.5 Sonnet lanseres

Claude 3.5 Sonnet ble lansert 21. juni 2024. Den er er kan brukes helt gratis på Claude.ai og i iOS-appen.

Ifølge Anthropic utmerker Sonnet seg i logikk, kunnskap og koding. Den er spesielt god til å forstå nyanser, humor og komplekse instruksjoner.¹⁵

Eksempelvis løste Sonnet 64 % av kodeoppgavene den fikk. Claude 3 Opus greide bare 38 %.

Video: Claude 3.5 Sonnet av Anthropic.

Personvern i Claude

Anthropic har et mye mer robust fokus på personvern enn andre selskaper, som OpenAI.

Dette skriver de:

«Vi trener ikke våre generative modeller på brukerdata med mindre brukeren gir oss eksplisitt tillatelse til å gjøre det. Til dags dato har vi ikke brukt kunde- eller brukerdata til å trene opp AI.»
– Anthropic¹⁶

Den eneste måten Anthropic bruker dataene dine, er hvis du gir de eksplisitt tillatelse.¹⁷

Lykke til med testingen!

Endringslogg

Her er en oversikt over endringene vi har gjort i artikkelen: