Hopp til hovedinnhold

Språk på anbud. Språkteknologi og innkjøpsmakt


Alle norske språkbrukere har rett til å få møte språket sitt i kontakt med statlige virksomheter, også når de fyller ut et nettskjema eller chatter med en praterobot. Det får de ikke alltid i dag. – Norsk i språkteknologi har vært en seig materie i 30 år, sier teknologidirektør i Microsoft Norge, Shahzad Rana. Kan den nye språkloven føre til endringer?

Åse fra Drammen skal betale restskatten sin og har noen spørsmål. Hun går inn på skatteetatens nettside og får kontakt med en praterobot. Åse har tidligere valgt nynorsk som foretrukket språk i kommunikasjon med skatteetaten. Hun vet at den nye språkloven gir henne rett til å få svar på nynorsk, og at rettigheten også gjelder når korrespondansen er digital, og det er etatens praterobot som svarer i andre enden. «Hei!», skriver Åse. «Kan eg få kontakt med ein rådgjevar?». Skatteetaten svarer: «Jeg forstår at du ønsker å få kontakt med en saksbehandler».

Åse er bedre orientert om språklige rettigheter enn de fleste og svært interessert i språkpolitikk. Hun vet at eksempelet viser noe mer enn en enkelt praterobot i staten som ikke kan nynorsk. Det står jevnt over dårlig til med statens etterlevelse av språkvekslingskravet i språkloven, på alle plattformer. Korrespondansen med skatteetatens praterobot er også et eksempel på en utvikling som rammer alle små språk i verden i dag: De taper terreng og utviklingsmuligheter når tjenester, innhold og samhandling digitaliseres – i skolen, på fritiden og i offentlig tjenesteyting. I Norge har vi en språklov som pålegger det offentlige å styrke nynorsk som det minst brukte av de likestilte skriftspråkene våre. Likevel ser vi den samme utviklingen her. Hvorfor er det slik? Hva er egentlig problemet?

Shahzad Rana har vært i teknologibransjen i Norge i tre tiår og vet en del om hva det skorter på i utviklingen av språkteknologi på norsk, både bokmål og nynorsk.

Kunnskap og korpus

– For å utvikle språkteknologi trenger vi språkdata. I tillegg trenger vi tilgang til ekspertise som kan bistå med å analysere og anvende disse dataene. I Norge har vi hatt Språkbanken i flere år. Den lå «nedstøvet» en periode, men så valgte man heldigvis å revitalisere den, sier Rana.

Språkbanken ved Nasjonalbiblioteket er en fritt tilgjengelig base med språklige underlagsdata som teknologiutviklere kan benytte til utvikling av språkteknologi på norsk. Den inneholder både nynorsk- og bokmålsdata, men klart mindre nynorsk.

– Da Microsoft utviklet tale-til-tekst, var norsk det første språket utenom de store verdensspråkene denne teknologien ble utviklet for. Det var fordi Norge gjennom Språkbanken klarte å levere et digitalt talekorpus. Dette er et godt eksempel på en type offentlig-privat samarbeid som vi trenger å systematisere enda mer for felleskapets beste. I tillegg trenger vi å inkludere norske aktører som bygger videre på det andre utvikler av basisteknologi. Der er vi ikke i dag.

Kunnskap og korpus, altså. Men produktutvikling koster jo også penger?

– Ja, det er klart at teknologibedriftene også trenger et marked i andre enden, bekrefter Rana.
– Det må sikres en økonomisk modell for små norske teknologimiljøer som kan bygge videre på internasjonal teknologiutvikling og tilgjengelige språkdata for å lage språkteknologiprodukter på norsk, både bokmål og nynorsk, mener han.

Små språk kan ikke overlates til markedskreftene alene. Her har det offentlige et ansvar – og en mulighet, ifølge Rana. Det norske språkmangfoldet omfatter også språk som har minoritetsspråkstatus. Rana løfter fram hvilke gevinster språkteknologi for de aller minste språkene kan gi, både for enkeltmennesket og samfunnet:

– Vi har lett for å se på språkstøtten i digitale verktøy som en kostnad. Men hva med samfunnsgevinstene ved at minoritetsspråkene støttes i den digitale hverdagen? Verden blir stadig mer digitalisert, og for å sikre at alle, også minoritetsspråkbrukere, får ta del i denne utviklingen, må gode språkdata være på plass. Språkteknologien kan hjelpe folk igjennom skolegang, bidra til en bredere digital inkludering og gi økt effektivitet ved at flere får tilgang til digitale tjenester. Samfunnsgevinsten er så mye større enn kostnaden, påpeker Rana.

Klare krav

Men skal staten bare servere gulrøtter i form av data, språklig ekspertise og økonomisk sikring for å lokke teknologibransjen til å lage løsninger som er i tråd med lovverket?
– Nei da, mener Rana. Han vil ha pisk også, han vil ha krav.

– Nå har vi fått en språklov som slår fast at språkbrukerne har rettigheter, og loven stiller noen overordnede krav til teknologiløsningene i staten. Neste skritt må være å få på plass en felles tolkning av loven og hvordan det offentlige skal bruke innkjøpsmakten til å stille språkteknologiske krav til leverandører av digitale løsninger. En slik samkjøring er blant annet nødvendig for å sikre at elever som har rett til teknologiløsninger på nynorsk, ikke blir prisgitt ulike tolkninger av kravene i regelverket. Deretter blir det opp til leverandørene å tilpasse seg de felles kravene som blir stilt, og eventuelt få med seg språkfaglige miljøer for å få det til.

Men når markedene er små, vil ikke slike språkkrav bli veldig kostnadsdrivende for offentlige virksomheter? Språkstøtte for nynorsk er vel ikke akkurat hyllevare. Hva vil du si til innkjøpere som også ser det som sin oppgave å ha kontroll på pengebruken, for eksempel i skolen? Rana vil snu på det, og hevder sin språkrett:

– De språklige rettighetene mine er rettigheter jeg har som innbygger, og hvis ikke innkjøperne klarer å forvalte dem, så synes jeg ikke de gjør en god nok jobb. Beklager.

– Dessuten finnes det mye nynorsk språkteknologi som hyllevare i dag, påpeker Rana.

– Microsoft har støttet nynorsk og ulike samiske språk i mange år. Det er et større problem at dagens hyllevare ikke når brukerne som har krav på den.

Bruken er det beste vernet

Språket til Åse og teknologien til Shahzad har det til felles at de må brukes for å utvikle seg. Det er bruken som sikrer vedlikehold og driver utviklingen framover både for språk og teknologi.

– Bruken er det beste vernet. Det er språkbruken som bygger korpusene, sikrer investeringsviljen og legitimerer de nødvendige prioriteringene i teknologibedriftene og for innkjøperne, sier Rana.

Han illustrerer med en historie fra virkeligheten:

– Vi endte opp i en interessant diskusjon i fjor da jeg ble «kalt inn på teppet» av daværende kulturminister. Microsoft vurderte å avvikle støtte for nynorsk brukergrensesnitt i Outlook på iPhone, og det skapte en del misforståelser. Vi mente aldri å hindre folk i å skrive nynorske e-poster, men vurderte å kutte ut nynorske menyer ettersom det bare var noen få titalls brukere av nynorsk Outlook på iPhone. Det paradoksale er at det er flere som bruker polsk, spansk og svensk versjon av Outlook enn den nynorske – i Norge! Med slike tall kjemper Microsoft Norge i motvind når vi skal overbevise Microsoft i USA om å investere i og utvikle enda mer støtte for nynorsk i produktene våre.

Offentlig sirkulærteknologi

Det skal store mengder språkdata til for å utvikle moderne språkteknologiløsninger.

– Utviklingen og forbedringen av språkteknologi hos oss i dag innebærer ikke at noen sitter og programmerer manuelt, forklarer teknologisjefen.

– Det foregår ved tung maskininnlæring gjennom algoritmer for kunstig intelligens. Vi trener opp språkmodeller med store mengder språkdata. Deretter fortsetter finjusteringen av modellene etter hvert som de blir brukt. Enkelt sagt: Jo mer språkteknologien blir brukt, desto mer presis blir den.

For de minste språkene kan ikke språksamfunnet sikre tilstrekkelig bruk uten ekstra innsats og støtte. Da trengs det også politisk vilje og offentlige aktører som tar språkansvar. Det offentlige språkansvaret utøves gjennom innkjøpsmakten – innkjøperne må bestille teknologiløsninger som virker både på bokmål og nynorsk. Deretter må språkteknologien komme ut til brukerne og bli brukt i hverdagen, og til slutt må det offentlige dele sine språkdata med Språkbanken.

– Det er bruken som legger grunnlaget for vedlikehold og utvikling av språkbasene også, så det må være en loop. Det er helt avgjørende på sikt at nye språkdata som produseres når offentlige tjenester med språkteknologi blir brukt, finner veien tilbake til Språkbanken igjen, understreker Rana.

– Jeg håper lederne i offentlige virksomheter er seg sitt ansvar bevisst, for denne sirkulariteten angår også dem. Slik vil Språkbanken også bli bedre og vokse og fornye seg.

I veilederen for deling av språkdata på Digitaliseringsdirektoratets sider om datadeling står det mer om hva språkdata er, og hvordan de skal deles.

Hvis alle vil, kan vi få det til

Teknologiutviklingen raser av gårde. I framtida vil talespråket bli viktig i menneske–maskin-dialogen. Vi styrer snart både bilen og hjemmene våre med stemmen, tror Rana. Det byr på nye utfordringer for brukere av små språk, for innbyggere i språksamfunn med stort dialektmangfold, og for brukere av norsk tegnspråk, for å nevne noen.

– Derfor må vi få på plass nødvendige rammer for å sikre språkmangfoldet i møte med teknologiutviklingen, ivrer Shahzad Rana.

Han er teknologioptimist, men når han ser tilbake på 30 år i bransjen, kommer det et hjertesukk:

– Disse problemstillingene er jo ikke akkurat nye. Jeg har vært i IT-bransjen i over 30 år, og norsk i språkteknologi har vært et tema i alle disse årene. De teknologiske betingelsene er jo stort sett på plass, men jeg tror feltet mangler politisk tyngde. Det må sterkere politisk gjennomføringsvilje til.

Språkdagen 2022

På Språkdagen 8. november møtes statssekretær i Kunnskapsdepartementet, Halvard Hølleland, avdelingsdirektør i Nav, Espen Sunde, og Åse Wetås, direktør i Språkrådet og språkbruker som fikk betalt restskatten til slutt, til debatt om norsk språkteknologi, politisk vilje og innkjøpsmakt.

Lenker