De 16 viktigste AI-nyhetene og gjennombruddene i 2023

Dette er de viktigste AI-nyhetene i 2023 fra et norsk perspektiv.

De viktigste AI nyhetene i 2023
Adam Tzur

Skrevet av

Bildet over er laget med bildegeneratoren Midjourney.

1. ChatGPT fikk evnen til å se, høre og snakke

I 2023 tok ChatGPT flere steg mot å bli mer menneskeaktig.

Tidlig i året lanserte OpenAI en ny versjon av ChatGPT som kunne tolke og beskrive bilder. Den het GPT-4.

Du kunne for eksempel vise den en vannflaske, også ville AI-en gjenkjenne at det var en Imsdal-flaske.

Etterhvert fikk ChatGPT talegjenkjenning og sin egen AI-stemme. Den kunne transkribere lyd til tekst og svare deg på norsk. Den forstår ulike dialekter.

Når AI greier å gjøre mer enn å skrive tekst, sier vi at den er multimodal.

Video: Jeg spør ChatGPT hva det betyr at den er multimodal.

2. NorGPT ble vist frem på Arendalsuka

Den norske språkmodellen NorGPT ble lansert under Arendalsuka 2023. Den er utviklet av forskningssenteret NorwAI ved NTNU.

Dette var et av høydepunktene for norsk AI-forskning i år.

Modellen fungerer på samme måte som ChatGPT. NorGPT er trent på norsk tekst og kan kommunisere på bokmål og nynorsk. 

NorwAI ønsker å gjøre NorGPT tilgjengelig for ulike nasjonale formål.

NorGPT er et fundament som andre leverandører kan bygge sine tjenester på. Da snakker vi om digitale tjenester, helsetjenester, med mer.

Siden dette er en helnorsk modell vil den følge norske regler og krav til personvern og datavern.

Om NorGPT
Bilde: Jon Atle Gulla, Direktør for NorwAI, viste frem NorGPT på Arendalsuka. 

3. Tesla og Google viste frem fremtidens AI-roboter

Tesla og Google viste frem sine nyeste AI-drevne humanoide roboter.

Tesla avduket Optimus Gen 2, mens Google presenterte sin PaLM-E robot.

Begge disse eksemplene gir oss et innblikk i fremtidens AI-assistenter.

Teslas Optimus Gen 2

Videoen under viser at Optimus Gen 2 greier å gå, ta knebøy og flytte på egg uten å knuse de.

Ifølge Tesla skal roboten etter hvert overta repetitive og kjedelige oppgaver fra mennesker.1 Fox News og Ars Technica.

Video: Tesla.

Googles PaLM-E

I tillegg viste Google frem sin egen robot kalt PaLM-E. Den er utviklet ved hjelp av språkmodellen PaLM. Den forstår språk og kombinerer data fra sensorer og kamera.2 https://palm-e.github.io/

Videoen under viser at PaLM-E kan åpne skuffer og hente objekter:

Video: Google.

4. Midjourney revolusjonerte AI-bilder

I år hadde bildegeneratorer en eksplosiv vekst i popularitet.

Dette skyldtes i stor grad den raske utviklingen av Midjourney.

Midjourney v6 bil
Bilde: Et AI-bilde laget med Midjourney 6.

Midjourney ble lansert som en åpen beta i juli 2022. I august 2023 hadde Midjourney over 16 millioner brukere.3 Content Detector og Wikipedia

Men hvorfor er Midjourney blitt så populær?

  1. Verktøyet er tilgjengelig for alle.
  2. Du trenger ikke være kunstner eller designer.
  3. Du kan lage fotorealistiske bilder.

Midjourney hadde flere viktige oppdateringer i 2023, de viktigste var versjon 5 og 6. 

Versjon 5

Versjon 5 ble lansert i juli 2023. Den gjorde det vanskelig å skille AI-bilder fra ekte bilder.

Denne oppdateringen doblet oppløsningen, ga bedre bildekvalitet og muligheten til å redigere deler av bildet.

Versjon 6

Versjon 6 (alfa) kom i desember 2023, og den største endringen er at du kan legge inn tekst i bilder.

Midjourney v6 ugle
Bilde: En ugle laget med Midjourney 6.

5. Google Bard og Microsoft Bing ble med i chatbot-racet

ChatGPTs suksess fikk Google og Microsoft til å skyte fart i utviklingen av sine egne chatboter.

I februar 2023 lanserte Google sin Bard-chatbot, mens Microsoft lanserte en AI-drevet versjon av søkemotoren Bing med innebygd chatbot.

Her finner du chatbotene:

Hvem leder chatbot-racet mellom Google og Microsoft?

Foreløpig er det vanskelig å kåre en vinner i chatbot-racet mellom Google og Microsoft. 

Det som er sikkert er at begge selskaper satser tungt på teknologien.

Microsoft var tidlig ute med å implementere chatboten i Bing, Edge og Microsoft Copilot. 

Dette ga dem et forsprang. Samtidig er gratis tilgang til GPT-4 en stor fordel.

På sin side har Google store mengder brukerdata og nettinnhold å analysere fra søkemotoren sin. 

Språkmodellen som driver Google Bard ble oppgradert fra PaLM-2 til Google Gemini i desember.4 https://blog.google/technology/ai/google-gemini-ai/ 

Google skrøt modellen opp i skyene, men i etterkant har uavhengige tester vært skuffende. Gemini har ikke greid å slå ChatGPT.5 https://arxiv.org/abs/2312.11444 

6. Nye vitenskapelige oppdagelser med AI

Her er tre vesentlige vitenskapelige oppdagelser gjort med kunstig intelligens:

Google DeepMind lagde en AI som modellerer molekyler

I oktober utviklet DeepMind en AI som kan forutsi strukturen til nesten hvilken som helst molekyl. Dette kan ha stor betydning for utvikling av nye legemidler.6 Google Deepmind

Google Deepmind oppdaget 2 millioner nye materialer

Googles DeepMind har brukt AI til å forutsi strukturene til 2 millioner nye materialer. Dette kan brukes til å forbedre teknologier som batterier og solcellepaneler.7 Reuters og Google Deepmind

En algoritme oppdaget 200 nye DNA-sekvenser

Forskerne mente at oppdagelsen vil kunne føre til nye måter å redigere gener på.8 MIT

7. Elevenlabs lanserte realistiske AI-stemmer og AI-dubbing

I august 2023 lanserte Elevenlabs Eleven Multilingual v2. Modellen kan produsere AI-stemmer på 29 språk.

Her kan du høre en AI-stemme:

Video: Alice i eventyrland.

I oktober lanserte ElevenLabs AI-dubbing.

AI-dubbing bevarer stemmen intonasjonen til taleren.

Hensikten med verktøyet er å fjerne språkbarrierer, slik at folk over hele verden kan nyte innhold på sitt eget språk. 

Det er tross alt bare 6 % av verdens befolkning som har engelsk som morsmål. 75 % snakker ikke engelsk i det hele tatt.9 Cochrane og Sheffield Hallam University

Video: Ai-dubbing.

8. Bildegeneratoren Dall-E 3 ble integrert i ChatGPT

I oktober 2023 integrerte OpenAI bildegeneratoren Dall-E 3 i ChatGPT.

Her er et bilde laget med Dall-E 3: 

DALL E 3 i 2023

I mine tester greier ikke Dall-E lage like realistiske bilder som Midjourney. 

Men Dall-E sin største fordel er at du kan lage bilder i samtale med ChatGPT. 

Les mer: Slik lager du AI-bilder i ChatGPT.

Du kan for eksempel spørre om 10 ideer til futuristiske bilder i fremtidens byer. Så kan du be ChatGPT lage bilder av forslag #3 og #5.

Du kan også laste opp informasjon om selskapet ditt og be AI-en lage en logo som passer.

Det kan du ikke med Midjourney.

9. UiO og Sikt tilbød sikre chatboter til utleie

ChatGPT har flere utfordringer. Blant de er manglende personvern og datasikkerhet.

Alt du skriver inn i chatboten lagres, og kan brukes til å trene opp modellen.

Men ChatGPT tilbyr også et abonnement som ikke lagrer data (ChatGPT Enterprise). Denne versjonen lar bedrifter og institusjoner tilby ChatGPT som en trygg tjeneste.

I 2023 utviklet både Sikt og UiO sikre tjenester basert på denne modellen.

GPT UiO

GPT UiO ble lansert 15. september og kan brukes av studenter og ansatte ved Universitetet i Oslo. I tillegg kan andre instiutusjoner bestille GPT UiO.10 GPT UiO

GPT UiO oppfyller de strenge kravene universitetet og det norske lovverket stiller til personvern og sikkerhet.

Ifølge Uniforum hadde GPT UiO over 8000 brukere i oktober.11 Uniforum

Her er noen ting GPT UiO kan brukes til:

  • Som en del av undervisningen.
  • Som et verktøy for studenter.
  • Forskning med persondata opptil gule data.
  • Og mye annet…

Sikt KI-chat

Sikt KI-chat er spesielt tilpasset kunnskapssektoren. Den gir svar på englelsk, bokmål og nynorsk samtidig som at den ivaretar personvern og datasikkerhet.

Tjenesten kan bestilles av virksomheter i kunnskapssektoren. For å ta i bruk tjenesten må man ha Feide-pålogging.12 Sikt KI-chat

Språkmodellen leveres av Microsoft via Azure OpenAI (ChatGPT). Sikt leverer grensesnittet.

10. ChatGPT fikk utvidelser, filanalyse og GPTs

Utvidelser (plugins)

I mars rullet OpenAI ut utvidelser i ChatGPT. Dette er apper som utvider funksjonaliteten til ChatGPT.13 https://openai.com/blog/chatgpt-plugins

For eksempel kan en plugin koble ChatGPT til tjenester som bestiller flybilletter.

Per i dag har bare ChatGPT Pluss-brukere tilgang til plugins.

Filanalyse

Denne funksjonen lar deg laste opp Word-dokumenter, Excel-ark og PDF-er. Så kan du snakke med og analysere filene.

Dette er gull verdt når du vil oppsummere en rapport på 100 sider, for eksempel.

GPT-er

I november lanserte OpenAI skreddersydde versjoner av ChatGPT.

GPT-er gjør det enkelt for alle å lage sin egen variant av ChatGPT. Du kan også dele disse med andre.

Senere vil vi få tilgang til GPT-butikken. Der vil du kunne søke etter de mest nyttige assistentene.

11. Videogeneratorene Pika og Runway utfordret Hollywood

Videogeneratorer gjør om tekst og bilder til video.

RunwayML og Pika er de mest populære verktøyene for å lage AI-video.14 Tech Crunch

Begge verktøyene har bidratt til å gjøre videoproduksjon mer tilgjengelig. 

De er så enkle å bruke at de har senket terskelen for folk flest. Du trenger ikke skuespillere, sett, og store budsjett for å lage film.

Derfor mener jeg at AI-video vil erstatte Hollywood i fremtiden.

Her er en video laget med Pika:

Her er en video laget med Runway:

12. Over 1000 eksperter advarte om risikoen ved AI

I 2023 kom det flere advarsler fra AI-eksperter om risikoer tilknyttet kunstig intelligens.

En av oppfordringene kom i et åpent brev som ble offentliggjort i mars 2023. Det var undertegnet av over 1000 eksperter, akademikere og næringslivsledere.15 Tek 

Blant dem var Elon Musk (Tesla) og Steve Wozniak (Apple).

Brevet ba om en seks måneders pause i utviklingen av kraftige AI-systemer.

I mai 2023 kom nok en advarsel, denne gangen fra ledende AI-selskaper som OpenAI, Google DeepMind og Anthropic.16 NY Times

De skrev at å redusere risikoen fra AI bør være en global prioritet. 

Uttalelsen ble underskrevet av over 350 AI-eksperter, og fikk mye oppmerksomhet. 

Hvorfor advarte ekspertene?

Ekspertene er bekymret for at de mest avanserte AI-systemene kan frigjøre seg fra menneskelig kontroll. 

Andre er bekymret for at dagens AI-systemer allerede forårsaker skader, som tap av personvern, forsterking av fordommer, spredning av desinformasjon og klimabelastning.17 Scientific American

Men ikke alle er enige i at det er grunn til panikk. Noen AI-forskere mener advarslene er overdrevne og at frykten for «ondsinnet AI» er ren science fiction.

De påpeker at dagens AI-systemer fortsatt er svært begrensede, og at det er lenge til vi utvikler «kunstig generell intelligens«.

Uansett er det bred enighet om at myndighetene må regulere AI-bransjen bedre og at det trengs mer forskning på AI-sikkerhet.

Heldigvis har EU sin AI Act blitt vedtatt og det er blitt lansert en ny ISO-standard for utvikling av trygg AI.18 ISO og EU

13. Microsoft integrerte AI i Windows 11

I 2023 har Microsoft integrert kunstig intelligens i flere av sine produkter som er en del av Windows 11.

Dall-E i Paint

Bildegeneratoren Dall-E ble integrert i Paint. Dette åpner for kreative muligheter i et ellers ganske enkelt program.19 The Verge

Ifølge Microsoft gjør dette det lettere for folk å uttrykke seg visuelt. Med AI har de nå et verktøy som kan hjelpe dem med å visualisere ideene sine.20 Microsoft

Microsoft Copilot

Copilot er en AI-assistent som er designet for å hjelpe deg med oppgaver og svare på spørsmål.21 Microsoft

Bing AI

Den største AI-satsingen til Microsoft i 2023 er at søkemotoren Bing ble kombinert med språkmodellen GPT-4 (ChatGPT). Bing ble integrert i nettleseren Edge.22 Microsoft

Bing fikk dermed muligheten til å søke på nett og svare med ny informasjon. 

14. Sam Altman fikk sparken og tok UNO reverse

Det kom som et sjokk når Sam Altman fikk sparken som administrerende direktør i OpenAI i november 2023. Altman var en av grunnleggerne av selskapet som startet opp i 2015.23 OpenAI

Årsaken til oppsigelsen er usikker. Men det ryktes at Altman og styret i OpenAI hadde ulike syn på selskapets fremtid. 

Her er noen av ryktene som gikk:

  • Sam Altman hadde holdt igjen vesentlig informasjon for styret.
  • Altman ønsket å satse på kunstig generell intelligens, mens styret ville kommersialisere selskapet.

Det hele endte med at Altman måtte gå av.

Snuoperasjonen

Etter oppsigelsen snudde ting fort.

Altman hadde støtte blant de ansatte i OpenAI. Over 700 ansatte truet med å si opp dersom han ikke kom tilbake. Microsoft tilbød både ansatte og Altman stillinger i selskapet.24 The Verge

Det sies også at investorer la press på styret for å få Altman tilbake.

Bare noen dager senere kunngjorde OpenAI at Altman ville komme tilbake som administrerende direktør. Styret ble kastet.25 The Verge

Altman tok med andre ord en «UNO reverse».

15. Åpen AI gjorde sitt inntog (open source)

Flere bedrifter gjorde AI-modeller og -verktøy tilgjengelig for alle gjennom åpen kildekode.

Hugging Face

I løpet av 2023 har Hugging Face blitt en slags «GitHub for AI». Det er en plattform der forskere og utviklere kan dele AI-modeller.26 https://huggingface.co/ 

Hugging Face har over 480 000 modeller og 89 000 datasett. Det er et enormt økosystem med verktøy for maskinlæring. 

Her er noen AI-modeller som ligger ute på plattformen:

  • Stable Diffusion XL (SDXL)
  • Llama 2
  • Mixtral
  • Phi2
  • Open Dall-E

Stability AI med flere åpne AI-modeller

Stability AI er et selskap som utvikler åpen generativ AI. Selskapet har som mål å demokratisere AI. Filosofien deres er: «AI av folket, for folket».27 https://stability.ai/about 

Her er noen av modellene deres:28 https://stability.ai/ 

  • Stable Diffusion XL (SDXL) (gjør om tekst til bilde)
  • Stable Zero123 (gjør om bilder til 3D-objekter)
  • Stable Video (gjør om tekst og bilder til video)
Stable Zero123 Stability AI
Bilde: Et bilde blir om til en 3D-modell med Stable Zero123.

Llama 2 av Meta

Llama 2 er en samling med store språkmodeller.

I motsetning til mange andre språkmodeller, har Llama 2-modellene åpen kildekode. Lisensen tillater både kommersiell og ikke-kommersiell bruk.29 https://ai.meta.com/llama/ 

Dette betyr at hvem som helst kan laste ned modellene, bygge videre på dem og bruke dem i egne prosjekter.30 https://huggingface.co/blog/llama2

3D-avatarer (DiffusionAvatars)

Forskere ved Teknisk Universitet i München utviklet DiffusionAvatars. Dette er en metode for å lage 3D-avatarer med realistiske ansiktsuttrykk. Koden ligger ute på Github.31 Github

DiffusionAvatars
Bilde: 3D-avatarer med DiffusionAvatars

16. AIavisens spede begynnelse

AIavisen ble lansert 13. august 2023 som Norges første avis dedikert til kunstig intelligens.

Avisen ble startet av meg (Adam) fordi jeg savnet en norsk ressursside om AI-teknologi.

Målet med avisen er å bygge din kunnskap og kompetanse innenfor kunstig intelligens. Dette er et tema som vil få stor betydning for samfunnsutviklingen fremover, ifølge regjeringens nasjonale strategi for kunstig intelligens.32 Regjeringen

For øyeblikket består redaksjonen kun av meg. Jeg har rollen som journalist, redaktør og eier. 

Jeg føler at timingen er god for en dedikert norsk AI-avis. Interessen for fagfeltet vokser i takt med at stadig flere privatpersoner, virksomheter og offentlige etater tar i bruk AI.

På sikt er målet at AIavisen skal bli en ledende stemme og premissleverandør for AI-debatten i Norge.

Derfor søker avisen skribenter som ønsker å skrive frivillig for avisen.

Ta gjerne kontakt ved interesse: adam.tzur@sintef.no 

Det kommer flere spennende initiativer fra avisen i 2024!

Følg oss gjerne på Facebook og LinkedIn. Vi legger ut AI-nyheter, AI-bilder, nye artikler, og lignende.

Skroll til toppen