English(EN) Can Fine-Tuning Erase Your Edits? On the Fragile Coexistence of Knowledge Editing and Adaptation

研究：微调大型语言模型会显著侵蚀知识编辑

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

一篇新的研究论文探讨了大型语言模型（LLMs）中知识编辑（KE）与微调的相互作用。研究表明，对已编辑模型进行微调通常会导致所应用编辑的显著衰减，其中像GPT-J上的AlphaEdit等方法会损失超过25%的有效性。研究表明，仅微调已编辑的层可以消除这些编辑，同时对整体性能的影响最小，并且令人惊讶的是，微调未编辑的层会导致更大的编辑衰减。这项工作强调了在完整的LLM应用流程中评估知识编辑技术的重要性，以确保编辑的持久性并解决潜在的安全问题。 AI

影响强调了在对经过知识编辑的大型语言模型进行微调时，潜在的安全风险和效率降低。

排序理由在arXiv上发表的研究论文，详细介绍了关于大型语言模型知识编辑和微调的发现。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Yinjie Cheng, Paul Youssef, Christin Seifert, J\"org Schl\"otterer, Zhixue Zhao · 2026-06-30 04:00

微调能否抹去你的编辑痕迹？知识编辑与适应的脆弱共存之道

arXiv:2511.05852v4 Announce Type: replace-cross Abstract: Knowledge editing (KE) offers a lightweight alternative to retraining for updating large language models (LLMs). Meanwhile, fine-tuning remains the default operation for adapting LLMs to new domains and tasks. Despite thei…

报道来源 [1]

微调能否抹去你的编辑痕迹？知识编辑与适应的脆弱共存之道

相关实体

相关话题