English(EN) CAREF: Calibration-Aware Regularization for Explanation Faithfulness Without Rationale Supervision

新的CAREF框架在无监督情况下增强了LLM解释的忠实性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-28 04:00

研究人员开发了CAREF，一个新颖的参数高效微调框架，旨在提高大型语言模型生成解释的准确性和忠实性。该方法独特地将基于熵的校准与token级稀疏性控制结合到单一损失函数中，无需显式的推理监督。在使用Flan-T5的四个自然语言解释基准的评估中，CAREF-AQ变体在准确性和解释一致性方面表现优越，同时与LoRA等其他方法相比，仅使用了更少比例的可训练参数。 AI

影响这项研究引入了一种提高LLM可解释性和准确性的新颖方法，有望带来更值得信赖的AI系统。

排序理由这是一篇详细介绍LLM微调新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Naphat Nithisopa, Teerapong Panboonyuen · 2026-05-28 04:00

CAREF: 校准感知正则化，无需推理监督即可实现解释忠实性

arXiv:2605.27835v1 Announce Type: cross Abstract: We introduce CAREF, a parameter-efficient fine-tuning framework that jointly optimizes predictive accuracy and explanation faithfulness via calibration-aware regularization. At its core, CAREF couples entropy-based calibration wit…

报道来源 [1]

CAREF: 校准感知正则化，无需推理监督即可实现解释忠实性

相关实体

相关话题