研究人员推出FalAR,一个用于欧洲葡萄牙语议会话语的新型大规模语音语料库,旨在改进该语言的自动语音识别(ASR)。该语料库包含约5800小时的语音数据,跨越20年,并为1180名个人提供了说话人身份标注。实验表明,使用FalAR进行预训练可以显著提高ASR性能,将词错误率(WER)降低高达14%。 AI
影响 该语料库旨在显著提高欧洲葡萄牙语的ASR性能,弥补了与巴西葡萄牙语相比资源上的不足。
排序理由 该集群包含一篇详细介绍用于ASR的新数据集的研究论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →