PulseAugur
实时 06:09:29
English(EN) Can Fine-Tuning Erase Your Edits? On the Fragile Coexistence of Knowledge Editing and Adaptation

研究:微调大型语言模型会显著侵蚀知识编辑

一篇新的研究论文探讨了大型语言模型(LLMs)中知识编辑(KE)与微调的相互作用。研究表明,对已编辑模型进行微调通常会导致所应用编辑的显著衰减,其中像GPT-J上的AlphaEdit等方法会损失超过25%的有效性。研究表明,仅微调已编辑的层可以消除这些编辑,同时对整体性能的影响最小,并且令人惊讶的是,微调未编辑的层会导致更大的编辑衰减。这项工作强调了在完整的LLM应用流程中评估知识编辑技术的重要性,以确保编辑的持久性并解决潜在的安全问题。 AI

影响 强调了在对经过知识编辑的大型语言模型进行微调时,潜在的安全风险和效率降低。

排序理由 在arXiv上发表的研究论文,详细介绍了关于大型语言模型知识编辑和微调的发现。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

研究:微调大型语言模型会显著侵蚀知识编辑

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Yinjie Cheng, Paul Youssef, Christin Seifert, J\"org Schl\"otterer, Zhixue Zhao ·

    微调能否抹去你的编辑痕迹?知识编辑与适应的脆弱共存之道

    arXiv:2511.05852v4 Announce Type: replace-cross Abstract: Knowledge editing (KE) offers a lightweight alternative to retraining for updating large language models (LLMs). Meanwhile, fine-tuning remains the default operation for adapting LLMs to new domains and tasks. Despite thei…