研究人员推出HATS,一个新设计的法语数据集,旨在通过整合人类感知来评估自动语音识别(ASR)系统。该数据集是通过让143人比较并选择由不同ASR系统生成的两个转录选项中的更好一个来创建的。此举旨在超越传统的词错误率(WER)等指标,这些指标被认为不足以从人类用户的角度评估ASR质量。 AI
影响 引入了一个用于评估ASR系统的新数据集,可能导致更符合人类的转录质量评估。
排序理由 该集群描述了一篇介绍用于ASR评估的新型数据集的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →