研究人员开发了SAGE(Spectral Activation-GEometry Sanitization),一种新颖的事后方法,用于提高大型语言模型(LLM)在遗忘过程后的保留能力。当前的遗忘技术通常会牺牲模型在保留数据上的性能。SAGE通过分析保留数据的激活几何来纠正遗忘更新向量,而无需重新运行整个遗忘流程。这种方法在各种遗忘方法和模型规模上一致地缓解了遗忘与保留之间的权衡。 AI
影响 增强了LLM的遗忘技术,可能导致数据删除后模型更加健壮和高性能。
排序理由 该集群包含一篇详细介绍LLM遗忘新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- arXiv
- cs.AI
- DagsHub
- Hugging Face
- IArxiv
- large language model
- SAGE
- Spectral Activation-GEometry Sanitization
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →