PulseAugur
实时 08:08:21
English(EN) Random Matrix Theory for Deep Learning: Beyond Eigenvalues of Linear Models

随机矩阵理论框架扩展了深度学习模型的分析

本文介绍了一个名为高维等价的新框架,该框架扩展了随机矩阵理论(RMT)以分析非线性机器学习模型,如深度神经网络(DNNs)。该框架解决了高维性、非线性以及过参数化模型中通用特征谱函数分析带来的挑战。该研究为各种网络类型的训练和泛化性能提供了精确的表征,捕捉了诸如缩放定律、双下降和非线性学习动态等现象。 AI

影响 为理解高维、过参数化设置下的深度学习提供了统一的理论视角。

排序理由 该条目是一篇发表在arXiv上的学术论文,详细介绍了一个用于分析深度学习模型的新理论框架。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

随机矩阵理论框架扩展了深度学习模型的分析

报道来源 [1]

  1. arXiv stat.ML TIER_1 English(EN) · Zhenyu Liao, Michael W. Mahoney ·

    Random Matrix Theory for Deep Learning: Beyond Eigenvalues of Linear Models

    arXiv:2506.13139v3 Announce Type: replace Abstract: Modern Machine Learning (ML) and Deep Neural Networks (DNNs) often operate on high-dimensional data and rely on overparameterized models, where classical low-dimensional intuitions break down. In particular, the proportional reg…