English(EN) Preferences of a Voice-First Nation: Large-Scale Pairwise Evaluation and Preference Analysis for TTS in Indian Languages

新研究评估了 7 个针对 10 种印度语言的 TTS 系统

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-23 09:44

研究人员开发了一个新的框架来评估印度语言的文本转语音（TTS）系统，解决了众包评估中通常出现的高方差问题。该框架使用跨越 10 种印度语言的受控、多维度成对比较，收集了来自 1900 多名母语人士的 120,000 多条判断。该研究评估了七个最先进的 TTS 系统，分析了跨越六个感知维度（如可懂度和语音质量）的偏好，以创建一个多语言排行榜并理解模型权衡。 AI

影响引入了一种新颖的多语言 TTS 评估方法，有望改善未来针对不同语言群体的语音合成开发。

排序理由详细介绍 TTS 系统新评估框架的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Mitesh M Khapra · 2026-04-23 09:44

语音优先国家的偏好：印度语言TTS大规模成对评估与偏好分析

Crowdsourced pairwise evaluation has emerged as a scalable approach for assessing foundation models. However, applying it to Text to Speech(TTS) introduces high variance due to linguistic diversity and multidimensional nature of speech perception. We present a controlled multidim…

报道来源 [1]

语音优先国家的偏好：印度语言TTS大规模成对评估与偏好分析

相关实体

相关话题