新的PEAR指标改进机器翻译评估

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-28 04:00

研究人员开发了PEAR，一种新颖的监督式机器翻译质量评估指标，它将评估重构为成对比较。该方法预测两个候选翻译之间质量差异的方向和幅度。尽管参数较少，PEAR的表现优于现有指标，包括更大的模型和基于参考的方法。它还被证明对最小贝叶斯风险解码有效，以最小的性能影响降低了计算成本。 AI

影响引入了一种更有效和更高效的机器翻译质量评估方法，有可能改进解码策略。

排序理由介绍机器翻译评估新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Lorenzo Proietti, Roman Grundkiewicz, Matt Post · 2026-05-28 04:00

PEAR: Pairwise Evaluation for Automatic Relative Scoring in Machine Translation

arXiv:2601.18006v2 Announce Type: replace Abstract: We present PEAR (Pairwise Evaluation for Automatic Relative Scoring), a supervised quality estimation (QE) metric family that reframes reference-free machine translation (MT) evaluation as a graded pairwise comparison. Given a s…