PulseAugur
实时 13:58:37

新的PEAR指标改进机器翻译评估

研究人员开发了PEAR,一种新颖的监督式机器翻译质量评估指标,它将评估重构为成对比较。该方法预测两个候选翻译之间质量差异的方向和幅度。尽管参数较少,PEAR的表现优于现有指标,包括更大的模型和基于参考的方法。它还被证明对最小贝叶斯风险解码有效,以最小的性能影响降低了计算成本。 AI

影响 引入了一种更有效和更高效的机器翻译质量评估方法,有可能改进解码策略。

排序理由 介绍机器翻译评估新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Lorenzo Proietti, Roman Grundkiewicz, Matt Post ·

    PEAR: Pairwise Evaluation for Automatic Relative Scoring in Machine Translation

    arXiv:2601.18006v2 Announce Type: replace Abstract: We present PEAR (Pairwise Evaluation for Automatic Relative Scoring), a supervised quality estimation (QE) metric family that reframes reference-free machine translation (MT) evaluation as a graded pairwise comparison. Given a s…