PulseAugur
实时 10:50:06
English(EN) Gradient Descent with Large Step Size Restores Symmetry in Deep Linear Networks with Multi-Pathway

大步长梯度下降重新分配了深度网络中的信号

研究人员已经证明,具有大步长的离散梯度下降与多通路深度线性网络中的梯度流会产生不同的结果。虽然梯度流预测会出现“赢家通吃”的情况,即特征集中在单个通路中,但本研究表明,大步长梯度下降会导致信号在通路之间重新分配。这种在稳定边缘发生的再平衡阶段,有利于共享表示而不是持续的单通路主导,从而阐明了网络深度如何影响通路竞争。 AI

影响 阐明了离散梯度下降动力学如何导致共享表示,这与通路专业化的理论预测形成对比。

排序理由 该集群包含一篇详细介绍机器学习新理论发现的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Hee-Sung Kim, Sungyoon Lee ·

    大步长梯度下降法恢复多路径深度线性网络的对称性

    arXiv:2606.05219v1 Announce Type: new Abstract: Recent analyses of multi-pathway Deep Linear Networks use Gradient Flow to predict a "winner-takes-all" specialization in which path symmetry breaks and each feature concentrates in a single pathway. In this work, we show that discr…