English(EN) Breaking Data Symmetry is Needed For Generalization in Feature Learning Kernels

机器学习中的“grokking”现象需要打破数据对称性来实现泛化

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-25 04:00

研究人员调查了机器学习中的“grokking”现象，即模型在训练中达到高准确率，但直到很久以后才能泛化到新数据。他们使用递归特征机（RFM）算法在代数任务上进行研究，发现泛化取决于打破训练数据集中特定的对称性。RFM算法似乎通过恢复数据中固有的不变性群作用来实现这一点，学习到的特征矩阵编码了该不变性群的元素，从而解释了对称性与泛化之间的联系。 AI

影响理解“grokking”现象可能通过识别关键数据属性，从而开发出更强大、更具泛化能力的AI模型。

排序理由该集群包含一篇详细介绍机器学习新发现的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv stat.ML TIER_1 English(EN) · Marcel Tom\`as Bernal, Neil Rohit Mallinar, Mikhail Belkin · 2026-06-25 04:00

Breaking Data Symmetry is Needed For Generalization in Feature Learning Kernels

arXiv:2604.00316v2 Announce Type: replace Abstract: Grokking occurs when a model achieves high training accuracy but generalization to unseen test points happens long after that. This phenomenon was initially observed on a class of algebraic problems, such as learning modular ari…

报道来源 [1]

Breaking Data Symmetry is Needed For Generalization in Feature Learning Kernels

相关实体

相关话题