English(EN) Lost in Interpretation: The Plausibility-Faithfulness Trade-off in Cross-Lingual Explanations

研究发现：跨语言大型语言模型解释可能缺乏忠实性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-19 02:44

一篇新的研究论文探讨了大型语言模型跨语言解释中的权衡问题。研究发现，为非英语输入生成的英语解释可能不如母语解释那样忠实于模型的实际推理过程，即使它们看起来很合理。这种忠实性的下降，以全面性和充分性衡量，可能非常显著，全面性与母语解释相比下降了多达5.7倍。研究表明，在输入语言中审计解释并使用多方面忠实性指标对于准确的模型评估至关重要。 AI

影响强调了跨语言大型语言模型审计中潜在的不准确性，并指出了对母语解释和可靠忠实性指标的需求。

排序理由该集群包含一篇详细介绍大型语言模型解释研究结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Animesh Mukherjee · 2026-05-19 02:44

失之毫厘，谬以千里：跨语言解释中的合理性-忠实性权衡

LLMs deployed multilingually are often audited via English explanations for non-English inputs. We evaluate extractive explanations ''where the model identifies input token spans as evidence alongside a generated rationale'' and uncover a systematic trade-off: English-pivot expla…

报道来源 [1]

失之毫厘，谬以千里：跨语言解释中的合理性-忠实性权衡

相关实体

相关话题