Skip to content

Latest commit

 

History

History
11 lines (9 loc) · 1.41 KB

README.md

File metadata and controls

11 lines (9 loc) · 1.41 KB

更好用户体验,建议参考WEB端官方文档 -> 【语音合成】

文字识别

语音合成(TTS)任务可以实现讲文字转化为语音,已经广泛应用于各种语音交互设备中。

  • 推荐模型
模型名称 模型简介
语音合成transformer_tts_ljspeech TansformerTTS 对 Transformer 和 Tacotron2 进行了融合,取得了令人满意的效果,英文TTS模型,仅支持预测。
语音合成fastspeech_ljspeech FastSpeech是基于encoder-decoder结构的teacher model中提取attention对角线来做发音持续时间预测,英文TTS模型,仅支持预测。
语音合成deepvoice3_ljspeech Deep Voice 3是百度研究院2017年发布的端到端的TTS模型(论文录用于ICLR 2018)。它是一个基于卷积神经网络和注意力机制的seq2seq模型,英文TTS模型,仅支持预测。