一种名为 GEMBA-MQM v2 的新方法利用大型语言模型来评估翻译质量,模仿了人类语言学家进行的详细错误分析。这种方法按类型和严重程度对翻译错误进行分类,提供结构化的细分,而不是单一分数。虽然大型语言模型评判员可能不一致,但运行多次并汇总结果有助于减轻这种干扰,从而实现更可靠的质量评估。 AI
影响 基于大型语言模型的翻译评估提供了一种可扩展的替代人工审查的方法,有可能提高翻译流程的效率。
排序理由 该集群描述了一种使用大型语言模型进行翻译质量评估的新方法,包括特定的基准测试结果。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →