English(EN) SAGE: Retain-Aware Post-Hoc Sanitization of Final Unlearning Vector

新的SAGE方法提高了LLM在遗忘后的保留能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-18 04:00

研究人员开发了SAGE（Spectral Activation-GEometry Sanitization），一种新颖的事后方法，用于提高大型语言模型（LLM）在遗忘过程后的保留能力。当前的遗忘技术通常会牺牲模型在保留数据上的性能。SAGE通过分析保留数据的激活几何来纠正遗忘更新向量，而无需重新运行整个遗忘流程。这种方法在各种遗忘方法和模型规模上一致地缓解了遗忘与保留之间的权衡。 AI

影响增强了LLM的遗忘技术，可能导致数据删除后模型更加健壮和高性能。

排序理由该集群包含一篇详细介绍LLM遗忘新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Jingyuan Zhang, Yucheng Bai, Peixi Wen, Zhehao Huang, Zhengbao He, Hanling Tian, Xinwen Cheng, Haiyin Ran, Xiaolin Huang · 2026-06-18 04:00

SAGE: Retain-Aware Post-Hoc Sanitization of Final Unlearning Vector

arXiv:2606.18309v1 Announce Type: cross Abstract: Large Language Model (LLM) unlearning aims to remove undesirable knowledge or behaviors while preserving retained capabilities. Current unlearning methods all involve a trade-off between unlearning and retention. We have found tha…

报道来源 [1]

SAGE: Retain-Aware Post-Hoc Sanitization of Final Unlearning Vector

相关实体

相关话题