研究人员推出了“Voice of India”,这是一个旨在改进 15 种主要印度语言自动语音识别 (ASR) 的新基准。与之前使用脚本语音的基准不同,该数据集包含来自 36,000 多名说话者的 536 小时非脚本电话对话。该基准考虑了印度语言中常见的拼写变体,并按地域分析 ASR 性能,揭示了地区差异以及音频质量和设备类型等因素。 AI
影响 解决了当前印度语言 ASR 系统的局限性,有可能提高语音技术在不同地区的可用性和易用性。
排序理由 该集群包含一篇介绍新基准数据集的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →