实体 GEMBA-MQM v2

GEMBA-MQM v2

PulseAugur coverage of GEMBA-MQM v2 — every cluster mentioning GEMBA-MQM v2 across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

时间线

2026-05-22 research_milestone GEMBA-MQM v2 is introduced as a method for LLMs to evaluate translation quality. 来源

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_44409 · May 22 · 14:53

大型语言模型评判员使用 GEMBA-MQM v2 评估翻译质量

一种名为 GEMBA-MQM v2 的新方法利用大型语言模型来评估翻译质量，模仿了人类语言学家进行的详细错误分析。这种方法按类型和严重程度对翻译错误进行分类，提供结构化的细分，而不是单一分数。虽然大型语言模型评判员可能不一致，但运行多次并汇总结果有助于减轻这种干扰，从而实现更可靠的质量评估。