PulseAugur
实时 02:42:38
English(EN) Preferences of a Voice-First Nation: Large-Scale Pairwise Evaluation and Preference Analysis for TTS in Indian Languages

新框架评估十种印度语言的TTS系统

研究人员开发了一个新的文本转语音(TTS)系统评估框架,特别针对印度语言。该框架使用众包的成对比较,跨越六个感知维度:清晰度、表现力、音质、活力、噪音和幻觉。该研究涉及超过1900名母语评分者,对7个最先进的TTS系统进行了超过120,000次比较,使用了10种印度语言的5000多句句子。结果提供了一个多语言排行榜,并分析了模型的权衡。 AI

影响 为评估TTS质量,特别是代表性不足的语言的TTS质量,建立了一个新的基准,有可能推动多语言语音合成的改进。

排序理由 学术论文,详细介绍了一种新的TTS系统评估方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新框架评估十种印度语言的TTS系统

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Srija Anand, Ashwin Sankar, Ishvinder Sethi, Aaditya Pareek, Kartik Rajput, Gaurav Yadav, Nikhil Narasimhan, Adish Pandya, Deepon Halder, Mohammed Safi Ur Rahman Khan, Praveen S V, Shobhit Banga, Mitesh M Khapra ·

    Preferences of a Voice-First Nation: Large-Scale Pairwise Evaluation and Preference Analysis for TTS in Indian Languages

    arXiv:2604.21481v2 Announce Type: replace Abstract: Crowdsourced pairwise evaluation has emerged as a scalable approach for assessing foundation models. However, applying it to Text to Speech(TTS) introduces high variance due to linguistic diversity and multidimensional nature of…