KB <3 AI

6 mars 2025 | Henrik Krantz
Kungliga Biblioteket (KB) har tagit fram en egen AI-modell som transkriberar tal till text. KB själva kallar modellen för en milstolpe för taligenkänning på svenska eftersom den har väldigt god kännedom om svenska språket.
Modellen har tränats på bland annat tv-sändningar, ljud från riksdagsdebatter och inspelningar av olika dialekter från Institutet för språk och folkminnen (ISOF). Allt för att få en så bred variation av talad svenska som möjligt.
Först med gedigen träning på svenska
Modellen bygger på företaget Open AI:s modell Whisper som funnits ett bra tag och som används i flera tjänster för transkribering. KB:s version är den första med gedigen träning på svenska. Enligt tester presterar KB Whisper bättre svenska än den amerikanska versionen. Nu är det fritt fram att skapa nya tjänster med modellen, något som exempelvis Sveriges Television undersöker för att förbättra textningen av sändningar.
Demokratiskt förankrad AI
I ett pressmeddelande säger KB själva att de har en unik position när det kommer till att ”demokratisk AI” som dels speglar alla variationer av svenska språket och som dels kan användas för att låsa upp tidigare otillgängligt material från KB:s arkiv för forskning.
Fakta om KB Whisper
KB-Whisper är en tal-till-textmodell som har tränats på stora mängder data för att lära sig omvandla talat språk till text. Modellen utgår ifrån det amerikanska företaget Open AI:s modell Whisper. Modellen är gratis att ladda ner från Hugging Face och använda.

Henrik Krantz
Utvecklingsledare
Göteborgsregionens Innovationsarena
henrik.krantz@goteborgsregionen.se