Hopp til hovedinnhold

Ai, ai, ai! En nordisk praterobot?


Det hjelper ikke å ha «snille» nordiske data dersom de blir puttet inn i en «slem» språkmodell. Derfor bør de nordiske landene satse på en egen GPT, sier Magnus Sahlgren i AI Sweden.

AI Sweden er det nasjonale senteret for anvendt KI i Sverige. Senterets oppdrag er å få fart på bruken av KI i samfunnet. Magnus Sahlgren er forskningssjef og driver en språkteknologisk lab der de konsentrerer seg om store språkmodeller. Men hvorfor skal vi bygge språkmodeller her i Europa når ChatGPT allerede fungerer såpass bra?

– Da vi starta laben, hadde vi en ambisjon om å bygge kompetanse nasjonalt. På den tida fantes det ingen modeller som støtta svensk bra. Etter hvert har ChatGPT kommet, i tillegg til Copilot og mange andre prateroboter. Alle disse kan svensk og norsk ganske godt. Men både ChatGPT og andre modeller er trent på materiale som er beskytta av opphavsrett. Utviklinga av modellene er ikke transparent, og vi vet for lite om hva slags data de er trent på.

Restriktivt regelverk

Sahlgren sier at de nordiske landene bør samarbeide om å samle språkdata på en etterrettelig måte.

– Jeg mener at vi i Norden kan håndtere innsamling av treningsdata på en bedre måte enn de store amerikanske selskapene. Modellene vi bygger, skal speile kulturen, verdiene og de nordiske holdningene våre.

Er det mulig å utvikle god teknologi som også ivaretar opphavsrett og personvernlovgivning?

– Det er et åpent spørsmål. Vi vet ikke. For å trene modellene må vi ha mye data av god kvalitet. Om vi må forholde oss til opphavsrett og personvern, kommer vi knapt til å ha data igjen å trene på. Da havner vi i en situasjon der vi ikke kan produsere egne modeller, men må kjøpe data fra USA. Det er en litt låst situasjon, og vi trenger å finne en pragmatisk løsning som alle er med på.

Norden er en interessant region

Mange land bevilger penger nasjonalt for å bygge språkmodeller. I Norge blir det utviklet modeller både ved Universitetet i Oslo og NorwAI. I tillegg finnes det felleseuropeiske satsinger. Sahlgren mener imidlertid at også det nordiske nivået er relevant å satse på.

– I Skandinavia har vi språk som er veldig like hverandre. I stedet for å bygge modeller i hvert land burde vi samle alle dataene og bygge en felles modell. Men det finnes ingen midler i Norden, så jeg ønsker å løfte disse spørsmålene og jobbe for å få en felles finansiering.

Ingen av initiativene for bygging av språkmodeller i EU har vært tilpassa satsingene i Norden. Det er likevel mye som ligger til rette for at Norden burde være interessant for EU, mener Sahlgren.

– Vi ligger ganske langt framme teknisk i Norden, vi har bygd nasjonale modeller tidlig, vi har vært ledende i EU, vi har interessante språkvariasjoner, og vi har nasjonalbibliotek. EU-kommisjonen vet nok alt dette, men det har ikke vært noen satsinger på Norden så langt. Jeg skulle gjerne sett at de nordiske landene var mer aktive overfor EU.

Har konsekvenser for språkutviklinga

I den teknologiske verdenen vil de største språkene lettest vinne terreng. Hvordan ser framtida ut for de relativt små språkene her i nord? Sahlgren er optimistisk, men han mener at vi må handle raskt.

– Jeg tror vi står ved et vegskille akkurat nå. Om vi finner en måte å skaffe finansiering og dele ressurser på, tror jeg vi kommer til å være en av de ledende regionene. Men om strenge reguleringer hindrer utviklinga, blir vi liggende etter. Språkene våre har absolutt livets rett i den teknologiske utviklinga, og med de rette grepene kan språkene våre gjøre oss til en interessant geografisk region.

Hva er risikoen om vi ikke lager språkmodeller selv?

– En av risikoene er påvirkninga på språket. Om det blir slik at vi bruker norsk og svensk med amerikansk brytning i KI-verktøyene, kommer det til å påvirke hvordan språkene våre utvikler seg på alle nivå, både grammatisk og verdimessig. Når vi kjøper all KI-en fra utlandet, vil det påvirke både demokratiet, språkpolitikken og nasjonale interesser. Derfor håper jeg at politikerne hjelper oss med å finne fornuftige måter å regulere feltet på.

Abonnerer du på Språknytt?

Nyhetsbrevet gir deg sakene rett i innboksen: Les om språkutviklinga og språkpolitikken. Få tips og råd til bruk i språkhverdagen.

Ikke det? Registrer deg her!