两篇新的arXiv论文超越了标量损失函数,通过分析内部表征的演变来探索神经网络在训练过程中的内部动力学。第一篇论文引入了可观测矩阵动力学(OMD)来研究输入表征距离矩阵的光谱重组,区分了扩散和相变两种机制。第二篇论文将神经网络训练视为矩阵集合的随机演变,识别出预示着表征形成并连接可训练性与优化超参数的Baik-Ben Arous-Péché(BBP)相变。 AI
影响 这些论文为理解神经网络训练的内部动力学提供了新颖的理论框架,有望带来改进的优化和表征学习。
排序理由 两篇发表在arXiv上的学术论文,详细介绍了理解神经网络训练动力学的新理论框架。
- alphaXiv
- arXiv
- Baik-Ben Arous-Péché transition
- Bogomolny--Bohigas--Schmit
- CatalyzeX
- DagsHub
- Gotit.pub
- Hugging Face
- Observable Matrix Dynamics
- ScienceCast
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →