Den här webbläsaren stöds inte längre.
Uppgradera till Microsoft Edge och dra nytta av de senaste funktionerna och säkerhetsuppdateringarna, samt teknisk support.
Vilken aktivitet händer under förbearbetningsfasen av taligenkänning?
Ljudet konverteras till .wmv format.
Bakgrundsbrus läggs till i ljudsignalen.
Funktionsvektorer extraheras från ljudvågformen för modellering.
Vad är fonem?
Artefakter som tas bort från signalen som en del av rensningsprocessen.
Den minsta ljudenheten i tal.
AI-modeller som genererar ljud.
Varför är det viktigt att generera prosodi i talsyntesen?
Prosody maximerar volymen av ljudutdata.
Prosody översätter talet till lyssnarens språk.
Prosody säkerställer naturligt uttal och talkadens.
Du måste svara på alla frågor innan du kontrollerar ditt arbete.
Var den här sidan till hjälp?
Need help with this topic?
Want to try using Ask Learn to clarify or guide you through this topic?