Månadens profil: Christina Tånnander
Hur får man en talsyntes att uttala ortnamn, facktermer och engelska ord rätt? Och hur vet man att en uppläsning är bra? De frågorna intresserar Christina Tånnander, talteknolog på Myndigheten för tillgängliga medier, MTM, och industridoktorand på KTH.
Vad gör du på jobbet?
– Jag är talteknolog och projektledare på MTM och industridoktorand på avdelningen för Tal, musik och hörsel på KTH. MTM:s uppdrag är bland annat att producera text i tillgängliga format som tal och punktskrift för personer som har svårt att läsa tryckt text, till exempel på grund av en synskada eller dyslexi. Vi producerar stora mänger talböcker och taltidningar med talsyntes, både med mänskliga röster och med text-till-talsyntes. I min forskning intresserar jag mig särskilt för talsyntes för långa och informationsrika texter, till exempel studielitteratur och nyhetstext. Här finns många utmaningar. Hur uttalar man facktermer? Hur läser man upp en tabell så att det blir begripligt? Lagparagrafer och matematiska formler? Det finns så mycket text som inte är tänkt att läsas upp, så hur läser man upp den? Det intresserar mig.
Just nu arbetar jag med att kunna styra uttalen i en talsyntes på ett detaljerat sätt. Det gör vi genom att använda särdrag. Vi kan till exempel använda ett språksärdrag för att gradvis styra hur mycket engelsk brytning som ska användas när en röst läser upp ett engelskt namn i en svensk text. Vi tränar också röster med fonologiska särdrag. Varje språkljud består av ett knippe särdrag som beskriver hur det ska uttalas, till exempel tungans position och om ljudet är tonande eller inte. Då får man en fingradig kontroll över språkljudens uttal.
Vi arbetar också mycket med utvärdering av talsyntes – hur vet man att det låter bra? Här behövs nya metoder som tar hänsyn till lyssningssituation och vad det är som ska läsas upp. Det ska kännas tryggt att lyssna, att sitta på helspänn i väntan på att det ska bli fel innebär en kognitiv belastning.
Vad händer framöver?
– Inom kort släpps uttalslexikonet Braxen som MTM tagit fram i samarbete med Språkbanken Tal. Lexikonet utökas kontinuerligt med nya nyhetsord och facktermer och kan användas för att hjälpa syntetiska röster att uttala saker rätt, till exempel latinska termer och utländska namn. I lexikonet finns 850 000 ord och namn som forskare, talsyntesföretag, förlag och andra kan ladda ner.
Men en del ord ska uttalas olika beroende på vilken kontext de förekommer i. Sifferuttryck och ord som modern och tomten har till exempel olika uttal och betydelser beroende på sammanhanget. Därför har MTM i samarbete med Språkbanken Tal utvecklat ett verktyg för talorienterad textprocessning, Sardin, som analyserar text för att avgöra hur saker ska läsas ut och uttalas. Detta verktyg kommer också att bli fritt för andra att använda.
Vad driver dig?
– Jag gillar blandningen av språk och teknik och självklart är det meningsfullt att göra en insats för människor som har svårt att läsa tryckt text. Dessutom händer det så mycket inom talsyntes. När kommer användaren själv att kunna välja exakt hur rösten ska låta: Ljus eller mörk? Artikulerad eller lite sluddrig? Med andningsljud eller utan? Och när kommer vi inte längre att kunna skilja på mänskligt och syntetiskt tal? Svar: inom en inte alltför avlägsen framtid. Den utvecklingen ska bli väldigt spännande att följa.
Publicerad den
Uppdaterad den