Microsoft tech översätter i användarens röst

Microsoft har avslöjat en teknik för talöversättning som tar ljudet av en användares röst och replikerar det på ett främmande språk.

Microsoft tech översätter i användarens röst

Textöversättare är inget nytt, och syntetiserade text-till-tal-översättare (TTS) har sålts till turister i flera år, men Microsofts teknik förvandlar en talares ord till något av 26 språk med sin egen röst.

Microsoft sa att systemet – kallat Monolinguist TTS – först behövde lära sig en användares röst för att känna igen orden, innan det konverterade dem till text och översatte det till målspråket.

”Ur en talares enspråkiga inspelningar kan vår algoritm återge talsatser på olika språk för att bygga blandade kodade, tvåspråkiga TTS-system,” sa Microsoft i dokument som visar tekniken.

Funktion

Varför du redan pratar 58 språk utan att försöka

För att efterlikna en användares röst behöver systemet en timmes träning för att utveckla en modell av ljud och toner, som sedan blandas med en databas med text-till-tal-svar för målspråket.

”Vi har inspelningar av 26 språk som används för att bygga vår text-till-tal av motsvarande språk,” sa Microsoft. ”Genom att använda den nya metoden kan vi syntetisera vilket blandat språkpar som helst av de 26 språken.”

Monolinguist TTS-mjukvaran kan paketeras med interaktiv hårdvara som satellitnavigatorer eller på mobila enheter, tillade Microsoft.

Lämna en kommentar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *