PulseAugur
实时 13:53:34
English(EN) Bypassing Minimization Bias: A Shift-Invariant Variance Estimator for Off-Equilibrium Local Learning Coefficients

新的SIVE方法改进了神经网络损失景观分析

研究人员开发了一种名为移不变方差估计器(SIVE)的新方法,以更准确地测量训练过程中神经网络损失景观的几何形状。在网络未处于稳定最小值时,估计局部学习系数(LLC)的传统方法容易产生偏差。SIVE通过使用一种基于方差的方法来解决这个问题,该方法固有地消除了未知的加性基线,从而能够更清晰地将几何损失波动与噪声分离开来。在玩具模型和深度神经网络上的实验表明,即使在旧方法失败的情况下,SIVE也能准确跟踪训练过程中的结构相变。 AI

影响 为理解和诊断神经网络训练动态提供了更强大的工具。

排序理由 详细介绍分析神经网络训练新技术的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的SIVE方法改进了神经网络损失景观分析

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Yingjia Cai ·

    绕过最小化偏差:一种用于非均衡局部学习系数的移不变方差估计器

    Singular Learning Theory leverages the Local Learning Coefficient (LLC) to quantify the geometry of neural network loss landscapes. However, mean-energy LLC estimators depend explicitly on an additive loss baseline, typically an estimate of the local minimum. During transient, of…