PulseAugur
实时 04:40:17
English(EN) Improving Large-Scale Weakly Supervised ASR by Filtering and Selection

新的ASR训练方法提高了在大规模数据集上的性能

研究人员开发了一种新方法,通过更有效地利用大规模、弱监督数据集来改进自动语音识别(ASR)模型。他们的方法包括三个步骤:首先在整个数据集上进行初始预训练,然后继续在通过字符错误率识别出的过滤子集上进行预训练,最后在声学上相似的小样本选择上进行微调。使用90,000小时的日语数据集进行的实验表明,字符错误率显著降低,过滤和选择方法分别独立将CER降低了高达6.4%和4.0%。 AI

影响 这项研究提供了一种通过优化嘈杂、大规模数据集的使用来增强ASR模型性能的方法,有望带来更准确的语音识别系统。

排序理由 该集群包含一篇详细介绍改进ASR模型新颖方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的ASR训练方法提高了在大规模数据集上的性能

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Kohei Matsuura, Masato Mimura ·

    Improving Large-Scale Weakly Supervised ASR by Filtering and Selection

    arXiv:2606.28728v1 Announce Type: cross Abstract: Leveraging large-scale weakly supervised datasets is crucial to train robust end-to-end automatic speech recognition (ASR) models. However, such datasets often contain noisy labels and lack domain specificity, limiting their effec…