研究人员开发了一个名为 Sometin Beta Pass Notin (SBPN) 的新多语言自动语音识别 (ASR) 框架,以提高尼日利亚语言的性能。该框架采用两阶段知识蒸馏过程,首先从单一语言模型进行蒸馏,然后通过伪标记数据的迭代自我改进。该方法在 Common Voice 和 Fleurs 等基准测试中,相对于基线平均降低了 29% 的词错误率,并且优于现有的最先进的多语言模型。SBPN 以两种尺寸发布为开放基础模型,旨在为该地区提供关键的 ASR 资源。 AI
影响 为资源匮乏的尼日利亚语言提供开源 ASR 模型,可能催生新的应用和研究。
排序理由 发布了一篇详细介绍新模型和方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- Common Voice
- Hausa
- Hugging Face
- Igbo
- Nigerian English
- Nigerian Pidgin
- Sometin Beta Pass Notin
- Yorùbá
- Nigerian languages
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →