PulseAugur
实时 16:39:46
English(EN) The Origin of Edge of Stability

研究人员查明神经网络“Edge of Stability”现象的起源

研究人员引入了一个名为“边缘耦合”(edge coupling)的新概念,以解释神经网络训练中已知的“Edge of Stability”现象。这个函数应用于连续的迭代对,有助于解释在全批量梯度下降过程中,最大的 Hessian 特征值为何会达到 $2/\eta$(其中 $\eta$ 是学习率)的阈值。所提出的方法在没有任何间隙的情况下精确地强制 Hessian 特征值,为这种观察到的行为提供了更统一的解释。 AI

影响 提供了一个理论框架,可能带来更稳定、更高效的神经网络训练。

排序理由 学术论文,详细阐述了对神经网络训练中某一现象的新理论解释。

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

研究人员查明神经网络“Edge of Stability”现象的起源

报道来源 [1]

  1. arXiv stat.ML TIER_1 English(EN) · Elon Litman ·

    The Origin of Edge of Stability

    Full-batch gradient descent on neural networks drives the largest Hessian eigenvalue to the threshold $2/η$, where $η$ is the learning rate. This phenomenon, the Edge of Stability, has resisted a unified explanation: existing accounts establish self-regulation near the edge but d…