Syntéza řeči

Syntéza řeči je umělá tvorba lidské řeči. Počítačové programy používané k tomuto účelu se nazývají „syntezátory řeči“. Programy „text na řeč“ (text-to-speech, TTS) produkují řeč z textu psaného běžným jazykem; existují i programy, které jako vstup využívají fonetickou transkripci.^[1] Řeč může být tvořena spojováním úseků nahrané řeči, které jsou uloženy v databázi. Takovéto databáze mohou obsahovat např. fóny a difóny nebo celá slova. V prvním případě je kvantita možného výsledku upřednostňována před kvalitou, v druhém je to naopak. Některé syntetizátory mohou řeč tvořit simulací charakteristik lidské řeči a vytvářet tak doslova umělou řeč.^[2]

Kvalita syntetizátoru řeči se posuzuje podle podobnosti výstupu s lidskou řečí. Schopné programy umožňují lidem se zrakovými vadami nebo poruchami čtení poslouchat psané texty. Mnoho operačních systémů obsahuje syntetizátory řeči od počátku 80. let.

Odkazy

Reference

V tomto článku byl použit překlad textu z článku Speech synthesis na anglické Wikipedii.

↑ Jonathan Allen, M. Sharon Hunnicutt, Dennis Klatt, From Text to Speech: The MITalk system. Cambridge University Press: 1987. ISBN 0-521-30641-8
↑ RUBIN, P.; BAER, T.; MERMELSTEIN, P. An articulatory synthesizer for perceptual research. Journal of the Acoustical Society of America. 1981, s. 321–328. doi:10.1121/1.386780.

Externí odkazy

Obrázky, zvuky či videa k tématu syntéza řeči na Wikimedia Commons

[1] Jonathan Allen, M. Sharon Hunnicutt, Dennis Klatt, From Text to Speech: The MITalk system. Cambridge University Press: 1987. ISBN 0-521-30641-8

[2] RUBIN, P.; BAER, T.; MERMELSTEIN, P. An articulatory synthesizer for perceptual research. Journal of the Acoustical Society of America. 1981, s. 321–328. doi:10.1121/1.386780.

[1]

[2]