MisoLabs发布Miso TTS 8B用于对话语音生成

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-21 00:06

MisoLabs发布了Miso TTS 8B，一个基于Sesame CSM架构构建的新文本转语音模型。该模型利用了Llama 3.2风格的骨干网络和一个自回归音频解码器，以生成高质量的对话语音并从音频提示中延续声音。该模型可通过其GitHub仓库进行本地使用，并在MisoLabs网站上提供演示。 AI

影响凭借其先进的架构，为语音生成和对话式AI的新应用提供了支持。

排序理由发布了一个具有技术细节和推理代码的新模型。[lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Trending Models 阅读 →

Llama 3.2
MisoLabs
Miso TTS 8B
Sesame CSM

模型发布
产品

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Hugging Face Trending Models TIER_1 English(EN) · MisoLabs · 2026-05-21 00:06

MisoLabs/MisoTTS

text-to-speech · 0 downloads · 46 likes

报道来源 [1]

MisoLabs/MisoTTS

相关实体

相关话题