OpenMOSS团队发布了MOSS-TTS-v1.5,这是他们文本转语音模型的更新版本。新版本在MOSS-TTS 1.0的功能基础上,引入了增强的多语言合成(支持语言标签)、更稳定的语音克隆(以提高说话人相似度),以及对长参考、短文本克隆场景的更好处理。MOSS-TTS-v1.5还提供了更稳定的标点符号韵律遵循,并通过内联标记引入了显式的停顿控制。 AI
影响 增强了开源文本转语音模型的多语言合成和语音克隆能力。
排序理由 这是一个开源文本转语音模型新版本的发布,属于研究范畴。[lever_c_demoted from research: ic=1 ai=1.0]
在 Hugging Face Trending Models 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →