Hopp til hovedinnhold

Stortinget tingar stor teknologi


Stortinget satsar på tale-til-tekst-teknologi for å effektivisere referatskrivinga frå stortingssalen og har investert i eit stort språkprosjekt. Prosjektet gjev gevinstar både til dei tilsette og til det norske språksamfunnet.

Det blir ført referat frå alle stortingsmøta. I gamle dagar var det stenografar til stades i salen som noterte alt som vart sagt. I nyare tid har ein teke opp lyd frå alle møta, slik at referata kan transkriberast etterpå utan at ein må notere alt som blir sagt i salen. I mai i 2022 vart den hittil siste nyvinninga introdusert: Kunstig intelligens skal gjera tale om til tekst.

Mette Solberg Ohlgren, som er seksjonsleiar i referentseksjonen, seier at dette arbeidsområdet er godt eigna for språkteknologi.

Mette Solberg Ohlgren | Foto: Stortinget– Vi har eit fantastisk utgangspunkt. Vi har store mengder lydopptak og tekstreferat som teknologien kan trena seg på. Og vi har kvart år fleire hundre timar med tale som skal bli transkribert. I utgangspunktet skal referata liggje så nær talen som mogleg, men dei skal også kunne fungere som tekst. Den nye teknologien gjev oss ein råtekst som vi kan redigere og arbeide vidare med.

Kva gevinstar får de ved å investere i eit slik språkprosjekt?

– Arbeidskvardagen blir meir variert. Nå kan referentane veksle mellom å transkribere sjølv frå botnen, og å redigere tekst som taleattkjenninga har transkribert. Når ein varierer arbeidet, er det lettare å sitja konsentrert over tid. Vi har òg eit håp om at det skal bli tidssparande når taleattkjenninga blir enda betre. Alt som blir utvikla av språkdata, blir stilt til rådvelde for Språkbanken. Så samfunnet vil også få gevinstar frå dette prosjektet, seier Ohlgren.

Frå alle dialektar til bokmål og nynorsk

På Stortinget kan alle representantane bruke si eiga dialekt, og kvar representant vel sjølv om hen vil bli referert på bokmål eller nynorsk. Det betyr at teknologien må forstå alle dialektar, og alle dialektar må kunne transkriberast til både bokmål og nynorsk. Målet er at ein stor del av referata skal skrivast ved hjelp av denne teknologien.

– Vi tok i bruk taleattkjenninga for fullt 1. mai i år. Det betyr at teknologien berre hadde vore i bruk eit par månadar før Stortinget tok pause. Teknologien treng å trena systematisk over tid. I dag er det slik at nokre dialektar blir kjende att lettare enn andre. Foreløpig fungerer teknologien best for bokmålsnære dialektar der talaren er godt førebudd. Folk snakkar ulikt, så diksjon og setningsoppbygging vil òg ha noko å seia for kor godt taleattkjenninga verkar. Same kor godt teknologien fungerer, må nokon med språkleg kompetanse gå igjennom og redigere og kvalitetssjekke referata.

Kva utfordringar har de støytt på i arbeidet?

– Det er alltid utfordringar når ein innfører noko nytt. Det er utfordringar med det tekniske, og det er utfordringar med ein ny arbeidsmetode. Og så er det ei utfordring at ordtilfanget er mykje større på bokmål enn på nynorsk. 90 prosent av alle referata er på bokmål. Skal løysinga bli betre, må vi ha meir nynorsk, og vi må skreddarsy løysinga betre for bruken vår. Ei anna utfordring var at koronapandemien braut ut da vi var midt i prosjektet, så vi måtte gjennomføre prosjektet via Teams. På den eine sida har det vore greitt å kommunisere digitalt, for leverandøren vår sit i Danmark. Men det er sjølvsagt krevjande når ein ikkje kan møtast i det heile tatt.

Blir verktøyet ferdig nokon gong?

– Nei, det er konstant læring. Det dukkar alltid opp nye ord, så det er umogleg å bli utlært.

Viktig tekstarbeid

Eli Fiskvik, som er avdelingssjef i kunnskaps- og dokumentasjonsavdelinga på Stortinget, fortel at dei brukte fleire år på å oppsøkje ulike språkmiljø, og at dei hadde kontakt med andre parlament i Europa og Norden for å finne ut kva andre gjorde.

Eli Fiskvik | Foto: Stortinget– På Folketinget i Danmark har dei ei løysing for «respeak», det vil seia at referentane på nytt snakkar inn det som representantane seier, så gjer teknologien talen om til tekst. På Island har dei ei løysing som liknar mykje på den vi har fått, der tale i plenumssalen blir konvertert frå lyd til skrift. Folketinget har lege litt framfor oss i løypa, så vi har hatt særleg stor nytte av å samarbeide med dei. I Norden har også Finland eit liknande prosjekt, så det har vore fint og nyttig å ha eit nettverk der vi kunne dele erfaringar og diskutere ulike løysingar. Etter å ha sondert terrenget i ganske lang tid følte vi oss klare til å gå i gang med vårt eige prosjekt i 2018.

Og det er ikkje tilfeldig at det er nettopp Stortinget som har gått i gang med eit stort språkprosjekt. Tekstarbeid er ein stor og viktig del av Stortingets oppgåve.

– På Stortinget leverer vi tekst som skal brukast i samfunnet. Det er svært viktige tekstar som lovar og vedtak. I det parlamentariske arbeidet ligg det mykje tekstarbeid. I administrasjonen er vi om lag 100 personar som arbeider med tekst. Da er det viktig at vi arbeider mest mogleg riktig og effektivt. Difor ynskte vi å sjå på kva slags moglegheiter som ligg i teknologien.

Fiskvik seier at ho også har eit personleg engasjement for å røkte og utvikle språket.

– Eg har tidlegare vore i forlagsbransjen og har arbeidd med språklege spørsmål. Eg har vore oppteken av korleis vi kan utvikle det norske språket i eit digitalt rom som stadig blir større. Dessutan er eg nynorskbrukar, og eg veit kva utfordringar nynorsken har i språkutviklinga. Eg synest det er viktig å arbeide for å ta vare på språket.

Bruk Språkbanken

Kva tips har de til andre verksemder som vil investere i løysingar som inneheld språkteknologi?

– Det beste tipset er å ta kontakt med Språkbanken. Vi hadde nytte av å ha kontakt med Språkbanken da vi starta opp, og dei bygde opp eit eige stortingskorpus som vi kunne bruke. Det er viktig at korpuset ein brukar, er knytt til verksemda; det er ikkje viktig å ha ei kjempeordbok med absolutt alle ord. Elles bør ein sondere litt og følgje med på kva som skjer i Noreg. Og vi på Stortinget har jo vore igjennom denne jobben, så det er lov å ta kontakt med oss, seier Fiskvik.