MisoLabs发布了Miso TTS 8B,一个基于Sesame CSM架构构建的新文本转语音模型。该模型利用了Llama 3.2风格的骨干网络和一个自回归音频解码器,以生成高质量的对话语音并从音频提示中延续声音。该模型可通过其GitHub仓库进行本地使用,并在MisoLabs网站上提供演示。 AI
影响 凭借其先进的架构,为语音生成和对话式AI的新应用提供了支持。
排序理由 发布了一个具有技术细节和推理代码的新模型。[lever_c_demoted from research: ic=1 ai=1.0]
在 Hugging Face Trending Models 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →