Hopp til hovedinnhold

Vi har nye nettsider, og nokre av dei er framleis under arbeid. Ser du feil eller manglar? Ta kontakt med nettredaktøren.

Hvordan dele språkdata?

Hvis du mener at virksomheten har språkdata som kan være til nytte for andre, kan de deles enten i Språkbanken eller i Felles datakatalog.


For en generell oversikt over deling av data anbefaler vi Digitaliseringsdirektoratets nasjonale verktøykasse for deling av data.  

Språkbanken 

Språkbanken er Norges nasjonale infrastruktur for språkteknologi. Hvis du mener at virksomheten har språkdata som kan ligge åpent og fritt tilgjengelig for alle, kan de deles i Språkbanken. Språkbanken tar imot kvalitetssikrede datasett av en viss størrelse. Det kan typisk være språkdata som allerede er tilrettelagt for, og brukt i, en KI-løsning eller i et annet språkteknologisk produkt. Ta kontakt med banken for å høre om de kan ta imot virksomhetens datasett. Språkbanken kan også ta imot språkmodeller.  

Felles datakatalog 

Felles datakatalog er en oversikt over tilgjengelige data fra offentlige virksomheter, og her kan man også finne og legge ut språkdata. I katalogen skal datasett beskrives med gode metadata, slik at andre kan vurdere om datasettet kan brukes til et aktuelt utviklingsprosjekt. Katalogen har egen hjelpeside for publisering av datasett. Noen datasett kan ikke deles fritt, men må deles under visse betingelser. Både personvernhensyn og opphavsrett kan hindre fri viderebruk. Likevel vil for eksempel andre offentlige virksomheter kunne dra nytte av dataene til å trene egne modeller i et lukket system. Husk at språkmodeller også kan gjenbrukes!  

Termportalen 

Termportalen er en nasjonal portal der det er mulig å søke etter termer og fagord på norsk og engelsk i termbaser for ulike fagområder. Ta kontakt med Termportalen direkte hvis virksomheten har terminologiske ressurser som den ønsker å dele.   

Fant du det du lette etter?