English(EN) Bypassing Minimization Bias: A Shift-Invariant Variance Estimator for Off-Equilibrium Local Learning Coefficients

新的SIVE方法改进了神经网络损失景观分析

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-21 08:32

研究人员开发了一种名为移不变方差估计器（SIVE）的新方法，以更准确地测量训练过程中神经网络损失景观的几何形状。在网络未处于稳定最小值时，估计局部学习系数（LLC）的传统方法容易产生偏差。SIVE通过使用一种基于方差的方法来解决这个问题，该方法固有地消除了未知的加性基线，从而能够更清晰地将几何损失波动与噪声分离开来。在玩具模型和深度神经网络上的实验表明，即使在旧方法失败的情况下，SIVE也能准确跟踪训练过程中的结构相变。 AI

影响为理解和诊断神经网络训练动态提供了更强大的工具。

排序理由详细介绍分析神经网络训练新技术的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Yingjia Cai · 2026-06-21 08:32

绕过最小化偏差：一种用于非均衡局部学习系数的移不变方差估计器

Singular Learning Theory leverages the Local Learning Coefficient (LLC) to quantify the geometry of neural network loss landscapes. However, mean-energy LLC estimators depend explicitly on an additive loss baseline, typically an estimate of the local minimum. During transient, of…

报道来源 [1]

绕过最小化偏差：一种用于非均衡局部学习系数的移不变方差估计器

相关实体

相关话题