English(EN) Data-Efficient On-Policy Distillation for Automatic Speech Recognition

新的蒸馏方法用更少的数据提升ASR模型性能

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-28 04:00

研究人员开发了一种数据高效的自动语音识别（ASR）模型训练方法，特别关注一个名为Ark-ASR的0.6B参数模型。通过从更大的Qwen-ASR教师模型进行策略内蒸馏，他们显著提高了Ark-ASR在普通话和英语基准测试上的性能。与现有方法相比，这种方法所需的监督音频数据大大减少，表明教师指导的训练可以有效地增强较小的ASR模型。 AI

排序理由该集群包含一篇学术论文，详细介绍了一种新的ASR模型训练方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Yu Lin, Yiming Wang, Runyuan Cai, Xiaodong Zeng · 2026-05-28 04:00

Data-Efficient On-Policy Distillation for Automatic Speech Recognition

arXiv:2605.28139v1 Announce Type: new Abstract: Building competitive automatic speech recognition (ASR) models usually requires large-scale au- dio supervision, which makes reproduction and specialization expensive. We study Ark-ASR, a 0.6B- parameter audio-conditioned language m…

报道来源 [1]

Data-Efficient On-Policy Distillation for Automatic Speech Recognition

相关实体

相关话题