PulseAugur
实时 09:33:08
English(EN) Preferences of a Voice-First Nation: Large-Scale Pairwise Evaluation and Preference Analysis for TTS in Indian Languages

新研究评估了 7 个针对 10 种印度语言的 TTS 系统

研究人员开发了一个新的框架来评估印度语言的文本转语音(TTS)系统,解决了众包评估中通常出现的高方差问题。该框架使用跨越 10 种印度语言的受控、多维度成对比较,收集了来自 1900 多名母语人士的 120,000 多条判断。该研究评估了七个最先进的 TTS 系统,分析了跨越六个感知维度(如可懂度和语音质量)的偏好,以创建一个多语言排行榜并理解模型权衡。 AI

影响 引入了一种新颖的多语言 TTS 评估方法,有望改善未来针对不同语言群体的语音合成开发。

排序理由 详细介绍 TTS 系统新评估框架的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新研究评估了 7 个针对 10 种印度语言的 TTS 系统

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Mitesh M Khapra ·

    Preferences of a Voice-First Nation: Large-Scale Pairwise Evaluation and Preference Analysis for TTS in Indian Languages

    Crowdsourced pairwise evaluation has emerged as a scalable approach for assessing foundation models. However, applying it to Text to Speech(TTS) introduces high variance due to linguistic diversity and multidimensional nature of speech perception. We present a controlled multidim…