PulseAugur
实时 23:10:29
English(EN) The Implicit Bias of Depth: From Neural Collapse to Softmax Codes

研究发现:神经网络中的深度会诱导隐式低秩偏差

研究人员探讨了神经网络中深度的隐式偏差,特别是在深度无约束特征模型(UFM)中。他们的分析侧重于梯度下降和无显式正则化的深度,揭示了深度本身会促进低秩偏差。这种偏差会促使解决方案偏离标准的神经坍塌,而是与先前在宽度瓶颈网络中观察到的最大间隔解决方案保持一致。该研究还确定了谱初始化如何影响奇异值,并描述了随着深度增加,神经坍塌吸引盆的收缩。 AI

影响 为深度神经网络的行为提供了理论见解,可能影响未来的模型架构和训练方法。

排序理由 在arXiv上发表的学术论文,详细介绍了关于神经网络行为的理论发现。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Connall Garrod, Jonathan P. Keating, Christos Thrampoulidis ·

    深度中的隐性偏差:从神经坍塌到Softmax编码

    arXiv:2605.23087v1 Announce Type: new Abstract: Neural collapse (NC) describes the structured geometry that emerges in the features and weights of trained classifiers. Recent theory suggests NC can be suboptimal in deep architectures, attributing this to an explicit low-rank bias…