English(EN) Preferences of a Voice-First Nation: Large-Scale Pairwise Evaluation and Preference Analysis for TTS in Indian Languages

新框架评估十种印度语言的TTS系统

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-24 04:00

研究人员开发了一个新的文本转语音（TTS）系统评估框架，特别针对印度语言。该框架使用众包的成对比较，跨越六个感知维度：清晰度、表现力、音质、活力、噪音和幻觉。该研究涉及超过1900名母语评分者，对7个最先进的TTS系统进行了超过120,000次比较，使用了10种印度语言的5000多句句子。结果提供了一个多语言排行榜，并分析了模型的权衡。 AI

影响为评估TTS质量，特别是代表性不足的语言的TTS质量，建立了一个新的基准，有可能推动多语言语音合成的改进。

排序理由学术论文，详细介绍了一种新的TTS系统评估方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Srija Anand, Ashwin Sankar, Ishvinder Sethi, Aaditya Pareek, Kartik Rajput, Gaurav Yadav, Nikhil Narasimhan, Adish Pandya, Deepon Halder, Mohammed Safi Ur Rahman Khan, Praveen S V, Shobhit Banga, Mitesh M Khapra · 2026-06-24 04:00

Preferences of a Voice-First Nation: Large-Scale Pairwise Evaluation and Preference Analysis for TTS in Indian Languages

arXiv:2604.21481v2 Announce Type: replace Abstract: Crowdsourced pairwise evaluation has emerged as a scalable approach for assessing foundation models. However, applying it to Text to Speech(TTS) introduces high variance due to linguistic diversity and multidimensional nature of…

报道来源 [1]

Preferences of a Voice-First Nation: Large-Scale Pairwise Evaluation and Preference Analysis for TTS in Indian Languages

相关实体

相关话题