Hva er generativ AI? Verktøyene som gjør deg effektiv og kreativ

Generativ AI lar deg lage bilder, video og tekst. Her får du en enkel forklaring på hvordan teknologien og AI-verktøyene fungerer.

Hva er generativ AI? Verktøyene som gjør deg mer effektiv og kreativ
Adam Tzur

Skrevet av

Sammendrag

  • Du kan skape kreative kunstverk med generativ AI.
  • Teknologien gjør deg også mer effektiv på jobb.
  • Du får mest ut av AI ved å lære «prompt engineering».
  • Det er flere fallgruver som du må unngå (f.eks. AI kan lyve).
  • Får du opphavsrett til innholdet du lager med AI?

Hva er generativ AI?

Generativ AI er kunstig intelligens som kan lage tekst, bilder, videoer, stemmer og musikk. Den mest kjente generative AI-en er ChatGPT.

Det kalles «generativ AI» fordi den kunstige intelligensen genererer (lager) noe nytt.

Noen synonymer er GenAI eller skapende kunstig intelligens.

Det finnes en rekke AI-verktøy som er generative. Noen eksempler er DALL-E for bilder, ElevenLabs for stemmer, og Stable Audio for musikk. 

Disse verktøyene bruker AI til å forutsi ord i en setning, piksler i et bilde eller noter i en melodi.

Teknologien har et enormt potensial til å endre mange bransjer. 

McKinsey anslår at generativ AI kan øke globalt bruttonasjonalprodukt med 2,6 til 4,4 trillioner dollar.1 McKinsey

Hvordan fungerer generativ AI?

Generative AI-modeller blir matet med milliarder av bilder, videoer eller ord. De lærer hva som er forskjellen på bildene, ordene eller videoene.

Deretter bruker modellen kunnskapen sin som et grunnlag til å lage noe nytt.

Litt mer teknisk forklart, brukes maskinlæring og dyplæring.

Maskinlæring, enkelt forklart

Maskinlæring brukes til å lære maskiner å gjennomføre oppgaver på egenhånd.

I tradisjonell programmering må utviklere skrive instruksjoner som maskiner bruker til å gjennomføre konkrete oppgaver.

Med maskinlæring analyserer algoritmer data for å finne sammenhenger. Basert på disse mønstrene så «lærer» den kunstige intelligensen.2 SNL

Et eksempel er ansiktsgjenkjenning:

  1. Først trenes en maskinlæringsmodell på tusenvis av ansiktsbilder.
  2. Så lærer den å gjenkjenne trekk som øyne, nese og munn. 
  3. Når modellen får et nytt bilde, kan den bruke det den har lært til å avgjøre om bildet inneholder et ansikt eller ikke.

Dyplæring, enkelt forklart

Dyplæring (deep learning) er en type maskinlæring. Den bruker en læringsmetode som er inspirert av menneskets hjerne, såkalte nevrale nettverk.3 SNL

Nettverkene har lag på lag med forbindelser som behandler informasjon.

De kan forstå ting som er for komplekse for mennesker.

Slik ser et nevralt nettverk ut:

Nevralt nettverk illustrasjon 2
Bilde: Et nevralt nettverk, illustrert av DALL-E 3.

Nettverket beskrives som en «svart boks». Du legger inn informasjon i den ene enden, så kommer det et svar ut i den andre enden.4 Nature

Svaret kan være tekst, bilder, video, og så videre.

5 typer generativ AI

AI som lager tekst (språkmodeller og chatboter)

En språkmodell forstår hvordan ord, setninger og paragrafer henger sammen.

Den analyserer språk og bruker det som grunnlag til å lage ny tekst.

ChatGPT er den mest kjente generative AI-en. Den bruker språkmodellene GPT-3.5 og GPT-4 til å produsere tekst.

Med språkmodeller kan du skrive alt fra e-poster og jobbsøknader til sosiale medie poster og bryllupstaler.

De fleste språkmodeller er fleksible fordi de er koblet på nett. De kan planlegge ferier, og søke i søkemotorer.

Her er de mest populære chatbotene og språkmodellene de bruker:

  • ChatGPT (bruker GPT-4)
  • Microsoft Bing (bruker GPT-4)
  • Google Bard (bruker Gemini Pro)
  • Claude (bruker Claude 2,1)

AI som lager bilder (bildegeneratorer)

En bildegenerator er en app som lager bilder ved hjelp av kunstig intelligens.

Bildegeneratorer lar oss skape AI-bilder og kunstverk som aldri er blitt laget før.

Det eneste du trenger å gjøre er å spørre AI-en om å lage det du vil ha.

Her er de mest populære bildegeneratorene:

  • Midjourney
  • DALL-E (integrert i ChatGPT og Bing)
  • Stable Diffusion (åpen kildekode)

Her er et eksempel på et AI-bilde laget med Midjourney 6:

Realistisk bilde av fugl, laget med Midjourney 6

AI som lager video (videogeneratorer)

En videogenerator er en app som lager videoer ved hjelp av kunstig intelligens.

Du kan lage AI-video ut ifra tekst eller et bilde. 

For eksempel kan du be om «en video av en mann som jogger i skogen».

Eller: «En rosa elefant som danser på månen med julebrus i hånda».

Her er det bare kreativiteten som setter en stopper for hva du kan lage.

Nå trenger du ikke lengre skuespillere eller kamera for å lage en film.

Her er de mest populære videogeneratorene:

  • RunwayML
  • Pika
  • Stable Video

Her er en AI-video om Harry Potter:

Video: Hva om Pixar lagde Harry Potter?

AI som lager musikk (musikkgeneratorer)

Med musikkgeneratorer kan du lage original musikk i en rekke sjangre, fra klassisk til pop og elektronika. Du velger blant annet sjanger, stil, tempo og tekst. 

Appene kan også brukes til å endre på eksisterende musikk eller til å lage lydeffekter.

AI-musikk er fortsatt i et tidlig stadie, men teknologien har allerede hatt stor en effekt på musikkbransjen.

Her er de mest populære musikkgeneratorene:

  • Stable Audio
  • Chirp
  • Soundraw

Her synger Frank Sinatra et AI-cover av Gangsta’s Paradise:

AI som lager stemmer (stemmegeneratorer)

Med stemmegeneratorer kan du lage AI-stemmer som høres ekte ut.

Du kan laste opp din egen stemme og trene opp generatoren til å etterligne deg. AI-en fanger opp tonehøyde, talehastighet, uttale og hvordan du puster. 

AI-en bruker denne kunnskapen til å lage nye setninger med en naturlig stemme.

Den mest populære stemmegeneratoren er ElevenLabs.

Den har ikke så mye konkurranse. Dessverre forstår den ikke norsk enda.

Her leser AI opp The Picture of Dorian Gray:

Slik får du mest ut av generativ AI

Prompt engineering

For å få gode resultater fra skapende AI, må du gi den gode instrukser. Dette kalles «prompt engineering» på engelsk.

Instruksen du gir er som en forespørsel til en assistent. Jo mer spesifikk og detaljert forespørselen er, desto bedre resultat får du.

Her kan du lese tips til å bli en god prompt engineer.

Instruksene dine er avhengige av hvilket AI-verktøy du bruker.

For eksempel er ChatGPT svært fleksibel i hva den kan gjøre.

Du kan skrive til ChatGPT og få svar i tekst, men du kan også be den lage et bilde av det dere snakker om.

Midjourney, derimot, krever at du gir spesifikke instrukser i et konkret format.

Hvis du vil at Midjourney skal bruke versjon 6, må du legge til –v 6 på slutten av instruksen. Hvis du vil at bildene skal være realistiske, må du legge til –style raw.

Lær hvordan verktøyene fungerer

AI-verktøy har ulike apper, nettsider og funksjoner.

Derfor tar det litt tid i å sette seg inn i hvert verktøy.

Jeg anbefaler at du velger ut 2-3 AI-verktøy og setter deg inn i de.

Med tiden vil du lære brukergrensesnittet og prompt engineering. Da får du ferdigheter som kan overføres til andre verktøy.

Her finner du en oversikt over de 20 nyttigste AI-verktøyene.

5 fallgruver å unngå

Her er fallgruvene du må unngå når du bruker generativ AI:

  1. Vage instrukser (f.eks. «Gjør meg mer effektiv på jobb»)
  2. For mye tillit: AI kan dikte opp fakta, kilder og sitater
  3. Brudd på opphavsrett
  4. Datalekkasje av persondata og bedriftshemmeligheter
  5. Å spre fordommer

Les mer om hvordan du unngår AI-fallgruvene.

Hvem eier AI-innholdet som lages?

Kort sagt kan bare mennesker ha opphavsrett.

Verket du lager må være et resultat av en original og skapende innsats, ifølge åndsverkloven.

Likevel får du kommersielle rettigheter av de fleste AI-tjenestene. Det vil si at du kan bruke AI-bildene, tekstene og videoene i din bedrift, eller privat.

Minuset er at mange AI-selskaper bruker det du legger inn i AI-en, og det du får ut. Da er ikke du nødvendigvis den eneste som får tilgang til innholdet.

Jeg anbefaler å lese disse sakene som går i dybden på temaet:

Takk for at du leste saken og lykke til videre!

Følg oss gjerne på Facebook og LinkedIn.

Skroll til toppen