AlphaEdit

实体 AlphaEdit

AlphaEdit

PulseAugur coverage of AlphaEdit — every cluster mentioning AlphaEdit across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

2

90 天内 2

发布 · 30天

0

90 天内 0

论文 · 30天

2

90 天内 2

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条

TOOL · CL_117729 · Jun 30 · 04:00

研究：微调大型语言模型会显著侵蚀知识编辑

一篇新的研究论文探讨了大型语言模型（LLMs）中知识编辑（KE）与微调的相互作用。研究表明，对已编辑模型进行微调通常会导致所应用编辑的显著衰减，其中像GPT-J上的AlphaEdit等方法会损失超过25%的有效性。研究表明，仅微调已编辑的层可以消除这些编辑，同时对整体性能的影响最小，并且令人惊讶的是，微调未编辑的层会导致更大的编辑衰减。这项工作强调了在完整的LLM应用流程中评估知识编辑技术的重要性，以确保编辑的持久性并解决潜在的安全问题。
RESEARCH · CL_103038 · Jan 27 · 18:58

新研究探讨多语言LLM缩放、知识整合和专业化评估

研究人员正在开发新方法和基准来提高大型语言模型（LLM）的能力和评估。Google DeepMind 推出了 ATLAS 框架，通过分析语言协同作用来优化多语言 LLM 训练。其他研究探索了低资源语言的结构化数据管道、混合深度集成（MoDE）等新颖的微调方法，以及知识库增强检索以提高事实准确性和透明度。此外，新的基准正在涌现，用于评估 LLM 在核工程等专业领域的表现，以及评估它们在不同语言中的推理能力、弃权能力和安全性。