研究人员开发了 CrispEdit,一种用于编辑大型语言模型 (LLM) 的新算法,该算法侧重于在修改特定行为的同时保留通用能力。该方法将编辑构建为一个约束优化问题,使用低曲率投影来确保更改不会破坏模型的广泛功能。通过采用 Kronecker-factored approximate curvature (K-FAC) 和无矩阵投影仪等技术,CrispEdit 实现了高效、可扩展的编辑,并在标准基准测试中以最小的能力下降显著提高了编辑成功率。 AI
影响 引入了一种新的 LLM 编辑方法,旨在提高性能并减少意外副作用。
排序理由 这是一篇详细介绍 LLM 编辑新算法的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →