English(EN) A Basin-Selection Perspective on Grokking via Singular Learning Theory

奇异学习理论为人工智能模型过拟合的涌现提供了新视角

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-08 04:00

研究人员探讨了“过拟合”（grokking）现象，即机器学习模型在长时间训练后突然从记忆转向泛化。利用奇异学习理论（SLT），他们提出过拟合涉及不同解盆地之间的转换，较低的局部学习系数（LLCs）表明有利于泛化的盆地。该研究推导了浅层二次网络的LLC解析公式，并表明估计的LLC轨迹可以有效地跟踪训练过程中泛化的开始。 AI

影响为理解神经网络中的泛化提供了一个理论框架，可能指导未来的模型训练策略。

排序理由这是一篇发表在arXiv上的研究论文，详细介绍了对机器学习现象的理论和实证研究。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Ben Cullen, Sergio Estan-Ruiz, Riya Danait, Jiayi Li · 2026-05-08 04:00

从涌现学习理论的盆地选择视角看Grokking

arXiv:2603.01192v3 Announce Type: replace-cross Abstract: Grokking, the abrupt transition from memorization to generalisation after extended training, suggests the presence of competing solution basins with distinct statistical properties. We study this phenomenon through the len…

报道来源 [1]

从涌现学习理论的盆地选择视角看Grokking

相关实体

相关话题