PulseAugur
实时 12:26:16

新理论将激波动力学与神经网络训练联系起来

研究人员在激波理论与人工神经网络中随机梯度下降的学习动力学之间建立了一个数学联系。通过应用微分几何、李群理论和流体力学原理,他们证明了这些网络的有效动力学可以用商流形上的粘性Hamilton--Jacobi方程来描述。此外,粗粒化损失函数的梯度遵循一个Burgers型方程,表明激波的形成是严格可能的。该框架已应用于多层感知机、卷积神经网络、Transformer和均值场网络等各种架构,暗示了深度学习中新诊断方法的潜力。 AI

影响 这一理论框架可能为监测和控制深度学习训练阶段带来新颖的诊断方法。

排序理由 该条目是一篇详细介绍人工神经网络理论研究的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Taiki Miyagawa ·

    A Link between Shock-wave Theory and Symmetry-reduced Stochastic Gradient Descent for Artificial Neural Networks

    arXiv:2606.18303v1 Announce Type: cross Abstract: We develop a mathematically explicit link between shock-wave theory and the symmetry-quotiented learning dynamics of stochastic gradient descent, drawing on differential geometry, Lie group theory, and fluid mechanics. Specificall…