两篇新的arXiv论文探讨了深度神经网络在训练过程中的谱动力学。一篇论文引入了“神经低秩滤波”(Neural LoFi)作为理论框架,将分层特征学习理解为一种迭代谱过程。另一篇论文使用动力学平均场理论分析隐藏权重谱的演变方式,预测宽网络中的离群行为和超参数迁移。 AI
影响 这些理论框架为理解深度神经网络的学习方式提供了新的视角,可能指导未来的模型开发和分析。
排序理由 两篇在arXiv上发表的学术论文,提出了理解深度学习的理论框架。
- Dynamical Mean-Field Theory (DMFT)
- GPT
- Gradient Descent
- ImageNet
- Dynamical Mean-Field Theory
- Neural Low-Degree Filtering
AI 生成摘要 · Google Gemini · 来自 5 个来源。 我们如何撰写摘要 →