Supertone 推出了 Supertonic 3,这是一个更新的设备端文本转语音模型,现在支持 31 种语言,远超其之前的五种语言。新版本提高了准确性,减少了重复和跳过等错误,并引入了用于内联控制笑声或叹息等情绪的表情标签。尽管功能有所扩展,该模型仍保持紧凑,参数量约为 9900 万,适合在资源受限的设备上部署,无需 GPU。 AI
影响 增强了设备端 TTS 功能,可在更广泛的语言和设备上实现更自然、更具表现力的语音界面。
排序理由 该集群描述了一个具有新功能和扩展语言支持的开源文本转语音模型新版本的发布。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →