PulseAugur
实时 15:25:44

OpenMOSS 发布 MOSS-TTS-v1.5,增强了语音克隆和多语言支持

OpenMOSS团队发布了MOSS-TTS-v1.5,这是他们文本转语音模型的更新版本。新版本在MOSS-TTS 1.0的功能基础上,引入了增强的多语言合成(支持语言标签)、更稳定的语音克隆(以提高说话人相似度),以及对长参考、短文本克隆场景的更好处理。MOSS-TTS-v1.5还提供了更稳定的标点符号韵律遵循,并通过内联标记引入了显式的停顿控制。 AI

影响 增强了开源文本转语音模型的多语言合成和语音克隆能力。

排序理由 这是一个开源文本转语音模型新版本的发布,属于研究范畴。[lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Trending Models 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. Hugging Face Trending Models TIER_1 (SL) · OpenMOSS-Team ·

    OpenMOSS-Team/MOSS-TTS-v1.5

    text-to-speech · 0 downloads · 52 likes