English(EN) Improving Large-Scale Weakly Supervised ASR by Filtering and Selection

新的ASR训练方法提高了在大规模数据集上的性能

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

研究人员开发了一种新方法，通过更有效地利用大规模、弱监督数据集来改进自动语音识别（ASR）模型。他们的方法包括三个步骤：首先在整个数据集上进行初始预训练，然后继续在通过字符错误率识别出的过滤子集上进行预训练，最后在声学上相似的小样本选择上进行微调。使用90,000小时的日语数据集进行的实验表明，字符错误率显著降低，过滤和选择方法分别独立将CER降低了高达6.4%和4.0%。 AI

影响这项研究提供了一种通过优化嘈杂、大规模数据集的使用来增强ASR模型性能的方法，有望带来更准确的语音识别系统。

排序理由该集群包含一篇详细介绍改进ASR模型新颖方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

Japanese

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Kohei Matsuura, Masato Mimura · 2026-06-30 04:00

Improving Large-Scale Weakly Supervised ASR by Filtering and Selection

arXiv:2606.28728v1 Announce Type: cross Abstract: Leveraging large-scale weakly supervised datasets is crucial to train robust end-to-end automatic speech recognition (ASR) models. However, such datasets often contain noisy labels and lack domain specificity, limiting their effec…

报道来源 [1]

Improving Large-Scale Weakly Supervised ASR by Filtering and Selection

相关实体

相关话题