研究人员开发了一种新方法,通过更有效地利用大规模、弱监督数据集来改进自动语音识别(ASR)模型。他们的方法包括三个步骤:首先在整个数据集上进行初始预训练,然后继续在通过字符错误率识别出的过滤子集上进行预训练,最后在声学上相似的小样本选择上进行微调。使用90,000小时的日语数据集进行的实验表明,字符错误率显著降低,过滤和选择方法分别独立将CER降低了高达6.4%和4.0%。 AI
影响 这项研究提供了一种通过优化嘈杂、大规模数据集的使用来增强ASR模型性能的方法,有望带来更准确的语音识别系统。
排序理由 该集群包含一篇详细介绍改进ASR模型新颖方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →