PulseAugur
实时 17:02:27
English(EN) A Polyak-Ruppert Central Limit Theorem for SA-Adam with Momentum and Non-Convergent Adaptive Preconditioning

新理论:SA-Adam 自适应性渐近不可见

研究人员发表了一篇论文,详细介绍了对自适应优化算法的理论分析,特别关注了带有动量和非收敛自适应预处理的 SA-Adam。该研究证明了在这种配置下存在一个非自治的 Polyak-Ruppert 中心极限定理,表明在迭代边际协方差方面,优化器的自适应性是渐近不可见的。这一发现表明,在某些条件下,特别是当动量增益亚线性衰减时,优化器的协方差结构会反映出普通随机梯度下降 (SGD) 的结构。 AI

影响 为自适应优化器的行为提供了理论基础,可能影响机器学习中未来的算法设计。

排序理由 该集群包含一篇在 arXiv 上发表的学术论文,详细介绍了优化算法的理论进展。

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新理论:SA-Adam 自适应性渐近不可见

报道来源 [2]

  1. arXiv stat.ML TIER_1 English(EN) · Sunyoung An, Xiaoming Huo ·

    A Polyak-Ruppert Central Limit Theorem for SA-Adam with Momentum and Non-Convergent Adaptive Preconditioning

    arXiv:2606.17364v1 Announce Type: cross Abstract: Adaptive optimizers combining preconditioning, momentum, and weight decay (Adam and AdamW) are, under Polyak-Ruppert averaging, candidate engines for one-pass inference. Does the averaged iterate keep the classical Polyak-Ruppert …

  2. arXiv stat.ML TIER_1 English(EN) · Xiaoming Huo ·

    A Polyak-Ruppert Central Limit Theorem for SA-Adam with Momentum and Non-Convergent Adaptive Preconditioning

    Adaptive optimizers combining preconditioning, momentum, and weight decay (Adam and AdamW) are, under Polyak-Ruppert averaging, candidate engines for one-pass inference. Does the averaged iterate keep the classical Polyak-Ruppert central limit theorem (CLT), with sandwich covaria…