实体
AlphaEdit
AlphaEdit
PulseAugur coverage of AlphaEdit — every cluster mentioning AlphaEdit across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
研究:微调大型语言模型会显著侵蚀知识编辑
一篇新的研究论文探讨了大型语言模型(LLMs)中知识编辑(KE)与微调的相互作用。研究表明,对已编辑模型进行微调通常会导致所应用编辑的显著衰减,其中像GPT-J上的AlphaEdit等方法会损失超过25%的有效性。研究表明,仅微调已编辑的层可以消除这些编辑,同时对整体性能的影响最小,并且令人惊讶的是,微调未编辑的层会导致更大的编辑衰减。这项工作强调了在完整的LLM应用流程中评估知识编辑技术的重要性,以确保编辑的持久性并解决潜在的安全问题。
-
新研究探讨多语言LLM缩放、知识整合和专业化评估
研究人员正在开发新方法和基准来提高大型语言模型(LLM)的能力和评估。Google DeepMind 推出了 ATLAS 框架,通过分析语言协同作用来优化多语言 LLM 训练。其他研究探索了低资源语言的结构化数据管道、混合深度集成(MoDE)等新颖的微调方法,以及知识库增强检索以提高事实准确性和透明度。此外,新的基准正在涌现,用于评估 LLM 在核工程等专业领域的表现,以及评估它们在不同语言中的推理能力、弃权能力和安全性。