讨论了两篇论文,一篇是2016年由Zhang等人发表的,另一篇是2019年由Nagarajan和Kolter发表的,它们对深度学习理论产生了影响。2016年的论文表明,标准神经网络可以轻松记住随机数据,挑战了基于假设类复杂度的现有泛化理论。随后的研究试图开发依赖于数据的界限,但2019年的论文被认为是对此类努力的又一次打击,表明一致收敛可能不足以解释深度学习的成功。 AI
影响 挑战了理解深度学习泛化的现有理论框架,可能重定向未来的研究方向。
排序理由 该集群讨论了学术论文及其对深度学习的理论意义。
- Bartlett, Foster, and Telgarsky
- Hardt, Recht, and Singer
- ImageNet
- Nagarajan and Kolter
- Neyshabur, Bhojanapalli, and Srebro
- Rademacher complexity
- SGD
- statistical learning theory
- Valiant
- VC dimension
- generalization bounds
AI 生成摘要 · Google Gemini · 来自 4 个来源。 我们如何撰写摘要 →