新基准旨在实现印度真实语音识别

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-26 04:00

研究人员推出了“Voice of India”，这是一个旨在改进 15 种主要印度语言自动语音识别 (ASR) 的新基准。与之前使用脚本语音的基准不同，该数据集包含来自 36,000 多名说话者的 536 小时非脚本电话对话。该基准考虑了印度语言中常见的拼写变体，并按地域分析 ASR 性能，揭示了地区差异以及音频质量和设备类型等因素。 AI

影响解决了当前印度语言 ASR 系统的局限性，有可能提高语音技术在不同地区的可用性和易用性。

排序理由该集群包含一篇介绍新基准数据集的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Kaushal Bhogale, Manas Dhir, Amritansh Walecha, Manmeet Kaur, Vanshika Chhabra, Aaditya Pareek, Hanuman Sidh, Mahima Manik, Sagar Jain, Bhaskar Singh, Utkarsh Singh, Tahir Javed, Shobhit Banga, Mitesh M. Khapra · 2026-05-26 04:00

Voice of India：印度真实语音识别的大规模基准

arXiv:2604.19151v2 Announce Type: replace Abstract: Existing Indic ASR benchmarks often use scripted, clean speech and leaderboard driven evaluation that encourages dataset specific overfitting. In addition, strict single reference WER penalizes natural spelling variation in Indi…

报道来源 [1]

Voice of India：印度真实语音识别的大规模基准

相关实体

相关话题