PulseAugur
实时 18:22:30

MisoLabs发布Miso TTS 8B用于对话语音生成

MisoLabs发布了Miso TTS 8B,一个基于Sesame CSM架构构建的新文本转语音模型。该模型利用了Llama 3.2风格的骨干网络和一个自回归音频解码器,以生成高质量的对话语音并从音频提示中延续声音。该模型可通过其GitHub仓库进行本地使用,并在MisoLabs网站上提供演示。 AI

影响 凭借其先进的架构,为语音生成和对话式AI的新应用提供了支持。

排序理由 发布了一个具有技术细节和推理代码的新模型。[lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Trending Models 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

MisoLabs发布Miso TTS 8B用于对话语音生成

报道来源 [1]

  1. Hugging Face Trending Models TIER_1 English(EN) · MisoLabs ·

    MisoLabs/MisoTTS

    text-to-speech · 0 downloads · 46 likes