Hva er SchibLM?
SchibLM (Schibsted Language Model) er norske språkmodeller.
Modellene er utviklet av mediekonsernet Schibsted, som er partner i NorwAI.1 NTNU
Fakta om NorwAI
Derfor utviklet Schibsted en egen AI:
- ChatGPT er lukket.
- Man blir avhengig av en amerikansk tjeneste.
- Det trengs norske språkmodeller som er gode på norsk.
Video av SchibLM
Simen Eide er AI-utvikler i Schibsted. I videoen under forklarer han hvordan teknologien funker (se fra 1:39:40).
Saken fortsetter under.
Bedre enn ChatGPT i blindtester
I 2023 gjennomførte Schibsted en blindtest hvor de sammenlignet sin egen modell opp mot ChatGPT. Målet var å lage de beste overskriftene.
«GPT-4 gjorde det fem ganger så dårlig som vår modell.»
– Simen Eide 4 Frokostmøte
Deres egne journalister (desken) vurderte overskriftene, uten å vite hvilken modell hadde laget de.
Resultatet var tydelig: ChatGPT (GPT-4) tapte.
Slik ble SchibLM utviklet
SchibLM bygges på AI-modeller som har åpen kildekode («open source»).
Simen Eide sier at AI-en trenes på avisartikler fra VG og Aftenposten, med flere.5 Frokostmøte
«Vi lager ikke en chatbot som du kan prate med.»
– Simen Eide 6 Frokostmøte
Likevel er det ikke en vanlig chatbot som ChatGPT, Gemini eller Copilot.
Den er spesialisert på konkrete oppgaver, som å lage titler, oppsummeringer og metabeskrivelser.
Schibsted har laget to modeller:
- SchibLM-6b-nor
- SchibLM-20b-nor
Om parametre 💡
Tallene 6b og 20b viser til hvor mange parametere modellene har, henholdsvis 6 milliarder og 20 milliarder. Det sier litt om hvor mye data modellene er trent på.
Til sammenligning ryktes det at GPT-4 har over en billion parametre.
Men, en større modell trenger ikke å være en bedre modell, som testen over viser.
Ikke en ChatGPT-konkurrent
SchibLM ikke er ment å være en konkurrent til ChatGPT eller lignende chatboter.
Simen understreker: «Vi lager ikke en chatbot som du kan prate med» og «vi skal ikke konkurrere med ChatGPT».7 Frokostmøte
I stedet fokuserer Schibsted på spesifikke problemer hvor de kan levere verdi.
Eksempelvis, lager de
- sammendrag av artikler
- overskrifter til artikler
- metadata
- metabeskrivelser
- SEO-titler
Vi får følge med på hvordan teknologien utvikler seg!