PulseAugur
实时 13:53:42
实体 word error rate

word error rate

PulseAugur coverage of word error rate — every cluster mentioning word error rate across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
4
90 天内 4
发布 · 30天
0
90 天内 0
论文 · 30天
3
90 天内 3
层级分布 · 90 天
最近 · 第 1/1 页 · 共 4 条
  1. RESEARCH · CL_18252 ·

    新范式通过将错误与人类感知相关联来改进ASR指标

    研究人员提出了一种用于评估自动语音识别(ASR)系统的新范式,旨在改进现有的词错误率(WER)和字符错误率(CER)等指标。所提出的方法结合了选定的指标来生成最小编辑距离(minED),该距离与人类感知有更好的相关性,并考虑了语言和语义信息。这种方法允许从人类的角度更细致地研究转录错误的严重性。

  2. RESEARCH · CL_11761 ·

    新的大语言模型统一音频和语言处理,支持全双工和医疗应用

    研究人员开发了UAF,这是一种新颖的统一音频前端大语言模型,专为全双工语音交互而设计。该模型将语音活动检测和轮流发言等各种音频前端任务整合到一个序列预测问题中。UAF旨在降低对话式AI系统的延迟并提高中断准确性。此外,Au-M-ol被提出作为一种多模态架构,将大语言模型扩展到医疗音频和语言理解领域,显著降低了医疗转录的词错误率。

  3. RESEARCH · CL_06335 ·

    研究人员推出RAS,一种用于可靠语音识别系统的新度量指标

    研究人员推出了一种名为RAS的新度量指标,旨在评估自动语音识别(ASR)系统的可靠性。与仅关注准确性的传统度量指标不同,RAS考虑了系统在转录中的置信度,尤其是在嘈杂或模糊的条件下。所提出的框架允许ASR模型在不确定的片段上弃权,RAS通过人类偏好进行校准,平衡了转录的信息量和避免错误。实验表明,这种方法在保持具有竞争力的准确性的同时,显著提高了转录的可靠性。

  4. TOOL · CL_03555 ·

    Gladia 开源标准化库以提高 STT 评估准确性

    一个名为 gladia-normalization 的新开源库已发布,旨在解决语音转文本 (STT) 模型评估中的不一致问题。该库在计算词错误率 (WER) 之前对转录文本进行标准化,防止格式差异被错误地标记为错误。该工具提供在 YAML 中定义的、可配置的标准化流程,确保评估过程具有确定性和版本可控性。