研究人员开发了一个新的框架来评估印度语言的文本转语音(TTS)系统,解决了众包评估中通常出现的高方差问题。该框架使用跨越 10 种印度语言的受控、多维度成对比较,收集了来自 1900 多名母语人士的 120,000 多条判断。该研究评估了七个最先进的 TTS 系统,分析了跨越六个感知维度(如可懂度和语音质量)的偏好,以创建一个多语言排行榜并理解模型权衡。 AI
影响 引入了一种新颖的多语言 TTS 评估方法,有望改善未来针对不同语言群体的语音合成开发。
排序理由 详细介绍 TTS 系统新评估框架的学术论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →