Dette er SchibLM (Schibsted Language Model)

SchibLM er språkmodellen som VG og Aftenposten bruker til å lage titler og sammendrag. ChatGPT var fem ganger dårligere i blindtester.

SchibLM (Schibsted Language Model)
Adam Tzur

Skrevet av

Hva er SchibLM?

SchibLM (Schibsted Language Model) er norske språkmodeller.

Modellene er utviklet av mediekonsernet Schibsted, som er partner i NorwAI.1 NTNU

Fakta om NorwAI

NorwAI er et forskningssenter som ledes av NTNU med 15 partnere.

Schibsted er en av industripartnerne som er med på å utvikle NorGPT.2 Schibsted

Et av hovedmålene til senteret er å utvikle ny AI-teknologi.

Senteret er finansiert av Norges forskningsråd.

Derfor utviklet Schibsted en egen AI:

  • ChatGPT er lukket.
  • Man blir avhengig av en amerikansk tjeneste.
  • Det trengs norske språkmodeller som er gode på norsk.

Video av SchibLM

Simen Eide er AI-utvikler i Schibsted. I videoen under forklarer han hvordan teknologien funker (se fra 1:39:40).

Saken fortsetter under.

Video: Simen Eide forklarer språkmodellen.
Simen Eide (Schibsted)

Simen Eide

AI-utvikler i Schibsted

Leder Schibsteds AI-enablement program.3 LinkedIn / Schibsted
Utdanning innen matematikk og datavitenskap (UiO).

Bedre enn ChatGPT i blindtester

I 2023 gjennomførte Schibsted en blindtest hvor de sammenlignet sin egen modell opp mot ChatGPT. Målet var å lage de beste overskriftene.

«GPT-4 gjorde det fem ganger så dårlig som vår modell.»

– Simen Eide 4 Frokostmøte

Deres egne journalister (desken) vurderte overskriftene, uten å vite hvilken modell hadde laget de.

Resultatet var tydelig: ChatGPT (GPT-4) tapte.

SchibLM blindtester titler
Bilde: Simen viser resultatene fra blindtesten.

Slik ble SchibLM utviklet

SchibLM bygges på AI-modeller som har åpen kildekode («open source»).

Simen Eide sier at AI-en trenes på avisartikler fra VG og Aftenposten, med flere.5 Frokostmøte

«Vi lager ikke en chatbot som du kan prate med.»

– Simen Eide 6 Frokostmøte

Likevel er det ikke en vanlig chatbot som ChatGPT, Gemini eller Copilot.

Den er spesialisert på konkrete oppgaver, som å lage titler, oppsummeringer og metabeskrivelser.

Schibsted har laget to modeller:

  • SchibLM-6b-nor
  • SchibLM-20b-nor

Om parametre 💡

Tallene 6b og 20b viser til hvor mange parametere modellene har, henholdsvis 6 milliarder og 20 milliarder. Det sier litt om hvor mye data modellene er trent på.

Til sammenligning ryktes det at GPT-4 har over en billion parametre.

Men, en større modell trenger ikke å være en bedre modell, som testen over viser.

Ikke en ChatGPT-konkurrent

SchibLM ikke er ment å være en konkurrent til ChatGPT eller lignende chatboter.

Simen understreker: «Vi lager ikke en chatbot som du kan prate med» og «vi skal ikke konkurrere med ChatGPT».7 Frokostmøte

I stedet fokuserer Schibsted på spesifikke problemer hvor de kan levere verdi.

Eksempelvis, lager de

  • sammendrag av artikler
  • overskrifter til artikler
  • metadata
  • metabeskrivelser
  • SEO-titler

Vi får følge med på hvordan teknologien utvikler seg!

Skroll til toppen