PulseAugur
实时 21:52:15

新基准旨在实现印度真实语音识别

研究人员推出了“Voice of India”,这是一个旨在改进 15 种主要印度语言自动语音识别 (ASR) 的新基准。与之前使用脚本语音的基准不同,该数据集包含来自 36,000 多名说话者的 536 小时非脚本电话对话。该基准考虑了印度语言中常见的拼写变体,并按地域分析 ASR 性能,揭示了地区差异以及音频质量和设备类型等因素。 AI

影响 解决了当前印度语言 ASR 系统的局限性,有可能提高语音技术在不同地区的可用性和易用性。

排序理由 该集群包含一篇介绍新基准数据集的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Kaushal Bhogale, Manas Dhir, Amritansh Walecha, Manmeet Kaur, Vanshika Chhabra, Aaditya Pareek, Hanuman Sidh, Mahima Manik, Sagar Jain, Bhaskar Singh, Utkarsh Singh, Tahir Javed, Shobhit Banga, Mitesh M. Khapra ·

    Voice of India:印度真实语音识别的大规模基准

    arXiv:2604.19151v2 Announce Type: replace Abstract: Existing Indic ASR benchmarks often use scripted, clean speech and leaderboard driven evaluation that encourages dataset specific overfitting. In addition, strict single reference WER penalizes natural spelling variation in Indi…