PulseAugur
实时 12:28:31
English(EN) Enhancing Multilingual Counterfactual Generation through Alignment-as-Preference Optimization

新框架Macro增强多语言LLM解释

研究人员开发了一个名为Macro的新框架,以改进多语言大型语言模型(LLM)的反事实解释生成。这个偏好对齐框架使用直接偏好优化(DPO)来平衡解释有效性和最小性之间的权衡,这对于非英语语言一直是一个挑战。跨七种语言的实验表明,Macro在不牺牲最小性的情况下显著提高了解释的有效性,优于链式思考(chain-of-thought)和监督微调(supervised fine-tuning)基线。 AI

影响 增强了LLM在多语言环境下的可解释性和可信度,可能提高用户信任度和调试能力。

排序理由 该集群包含一篇详细介绍改进LLM解释新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新框架Macro增强多语言LLM解释

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Simon Ostermann ·

    通过偏好优化对齐增强多语言反事实生成

    Self-generated counterfactual explanations (SCEs) are minimally modified inputs (minimality) generated by large language models (LLMs) that flip their own predictions (validity), offering a causally grounded approach to unraveling black-box LLM behavior. Yet extending them beyond…