研究人员开发了一个新的理论框架——随机塑造理论(Randomized Shaping Theory),来解释在持续学习中,零阶(ZO)适应方法为何可能比一阶(FO)方法遗忘更少。该理论认为,经过恰当分析的ZO适应,可以通过选择性地收缩适应的各向异性分量来保留更多先前获得的知识。这一理论洞见催生了一个名为RISE的新算法,它将校准过的ZO塑造应用于参数块内的精确FO梯度,以改善持续学习中的稳定-塑性权衡。 AI
影响 为持续学习的改进提供了理论解释,可能带来更强大的、能够随时间保留知识的AI系统。
排序理由 该集群包含一篇详细介绍持续学习的理论框架和提出的算法的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →