研究人员推出了 BEA-Dialogue+,一个用于匈牙利语对话式自动语音识别 (ASR) 的扩展语料库。这个新数据集将可用训练数据增加到 200 小时,放宽了分割标准以允许更多材料,同时保持说话人分离。使用 Whisper 和 FastConformer 模型进行的评估表明,更大的数据集,特别是与串行输出训练 (SOT) 微调结合使用时,可以显著提高转录准确性指标。 AI
影响 为匈牙利语对话 ASR 提供了一个更大、更具挑战性的基准,能够更好地训练和评估转录系统。
排序理由 该集群包含一篇详细介绍新数据集和 ASR 模型评估的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →