English(EN) Why Zeroth-Order Adaptation May Forget Less: A Randomized Shaping Theory

新理论解释了为什么零阶适应能减少模型遗忘

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-11 14:41

研究人员开发了一个新的理论框架——随机塑造理论（Randomized Shaping Theory），来解释在持续学习中，零阶（ZO）适应方法为何可能比一阶（FO）方法遗忘更少。该理论认为，经过恰当分析的ZO适应，可以通过选择性地收缩适应的各向异性分量来保留更多先前获得的知识。这一理论洞见催生了一个名为RISE的新算法，它将校准过的ZO塑造应用于参数块内的精确FO梯度，以改善持续学习中的稳定-塑性权衡。 AI

影响为持续学习的改进提供了理论解释，可能带来更强大的、能够随时间保留知识的AI系统。

排序理由该集群包含一篇详细介绍持续学习的理论框架和提出的算法的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Zhongxiang Dai · 2026-05-11 14:41

为什么零阶适应可能遗忘更少：一种随机塑形理论

Continual learning requires new-task adaptation without damaging previously acquired capabilities. Recent forward-pass and zeroth-order (ZO) results show that low-query adaptation may retain better than first-order (FO) descent, but the usual view of ZO as noisy FO estimation doe…

报道来源 [1]

为什么零阶适应可能遗忘更少：一种随机塑形理论

相关实体

相关话题