研究人员开发了一个新的文本转语音(TTS)系统评估框架,特别针对印度语言。该框架使用众包的成对比较,跨越六个感知维度:清晰度、表现力、音质、活力、噪音和幻觉。该研究涉及超过1900名母语评分者,对7个最先进的TTS系统进行了超过120,000次比较,使用了10种印度语言的5000多句句子。结果提供了一个多语言排行榜,并分析了模型的权衡。 AI
影响 为评估TTS质量,特别是代表性不足的语言的TTS质量,建立了一个新的基准,有可能推动多语言语音合成的改进。
排序理由 学术论文,详细介绍了一种新的TTS系统评估方法。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →