研究人员开发了一个新的框架来理解前馈ReLU神经网络的训练动力学。他们的工作将梯度下降重写为训练集空间上的集体动力学,而不是权重空间上的动力学。对于更深层的网络,这揭示了权重诱导算子的一种层级结构,该结构管理着层之间的信息流。 AI
影响 为分析和优化神经网络训练提供了新的理论视角。
排序理由 该集群包含一篇详细介绍神经网络训练动力学新理论框架的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →
研究人员开发了一个新的框架来理解前馈ReLU神经网络的训练动力学。他们的工作将梯度下降重写为训练集空间上的集体动力学,而不是权重空间上的动力学。对于更深层的网络,这揭示了权重诱导算子的一种层级结构,该结构管理着层之间的信息流。 AI
影响 为分析和优化神经网络训练提供了新的理论视角。
排序理由 该集群包含一篇详细介绍神经网络训练动力学新理论框架的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →
arXiv:2606.09744v1 Announce Type: new Abstract: We study feed-forward ReLU networks with fixed readout and quadratic loss. The aim is to rewrite gradient descent not primarily as a dynamics in weight space, but as a collective dynamics closed in terms of fields defined on the tra…
We study feed-forward ReLU networks with fixed readout and quadratic loss. The aim is to rewrite gradient descent not primarily as a dynamics in weight space, but as a collective dynamics closed in terms of fields defined on the training-set space. For a single hidden layer, the …