PulseAugur
实时 07:48:02
English(EN) Sometin Beta Pass Notin (SBPN): Improving Multilingual ASR for Nigerian Languages via Knowledge Distillation

新的 SBPN 模型通过知识蒸馏提升尼日利亚语言 ASR 性能

研究人员开发了一个名为 Sometin Beta Pass Notin (SBPN) 的新多语言自动语音识别 (ASR) 框架,以提高尼日利亚语言的性能。该框架采用两阶段知识蒸馏过程,首先从单一语言模型进行蒸馏,然后通过伪标记数据的迭代自我改进。该方法在 Common VoiceFleurs 等基准测试中,相对于基线平均降低了 29% 的词错误率,并且优于现有的最先进的多语言模型。SBPN 以两种尺寸发布为开放基础模型,旨在为该地区提供关键的 ASR 资源。 AI

影响 为资源匮乏的尼日利亚语言提供开源 ASR 模型,可能催生新的应用和研究。

排序理由 发布了一篇详细介绍新模型和方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的 SBPN 模型通过知识蒸馏提升尼日利亚语言 ASR 性能

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Sewade Ogun ·

    Sometin Beta Pass Notin (SBPN): 通过知识蒸馏改进尼日利亚语言的多语言自动语音识别

    Although modern multilingual Automatic Speech Recognition (ASR) systems support several Nigerian languages, their performance consistently lags behind high-resource languages like English and French. Nigerian languages present unique modelling hurdles, including acute data scarci…