研究人员开发了一个新的情感语音合成(ESS)系统,该系统将说话人嵌入和韵律瓶颈集成到FastSpeech 2模型中。该系统旨在生成具有所需情感表达的逼真、自然的语音。它可以为单个说话人生成情感语音,或在保留目标说话人身份的同时在说话人之间转移说话风格。 AI
排序理由 研究论文发布在arXiv上,详细介绍了一种新的情感语音合成模型。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →