English(EN) Conflicting Biases at the Edge of Stability: Norm versus Sharpness Regularization

新研究探讨神经网络泛化中的隐式偏差

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-08 04:00

研究人员已经证明，理解梯度下降的泛化性能需要分析各种隐式正则化形式的相互作用。他们的工作表明，学习率会影响参数范数和模型尖锐度之间的权衡。对于对角线线性网络，单独的范数最小化或尖锐度最小化都不足以解释良好的泛化，这表明需要对隐式正则化进行更广泛的视图。 AI

影响提供了对神经网络泛化更细致的理解，可能指导未来的模型训练技术。

排序理由该集群包含一篇详细介绍新研究发现的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv stat.ML TIER_1 English(EN) · Maria Matveev, Vit Fojtik, Hung-Hsu Chou, Gitta Kutyniok, Johannes Maly · 2026-06-08 04:00

Conflicting Biases at the Edge of Stability: Norm versus Sharpness Regularization

arXiv:2505.21423v3 Announce Type: replace-cross Abstract: The remarkable generalization properties of overparameterized networks are often attributed to implicit biases, such as norm minimization at small learning rates and low sharpness in the Edge-of-Stability regime. In this w…