PulseAugur
实时 15:13:45
English(EN) Breaking Data Symmetry is Needed For Generalization in Feature Learning Kernels

机器学习中的“grokking”现象需要打破数据对称性来实现泛化

研究人员调查了机器学习中的“grokking”现象,即模型在训练中达到高准确率,但直到很久以后才能泛化到新数据。他们使用递归特征机(RFM)算法在代数任务上进行研究,发现泛化取决于打破训练数据集中特定的对称性。RFM算法似乎通过恢复数据中固有的不变性群作用来实现这一点,学习到的特征矩阵编码了该不变性群的元素,从而解释了对称性与泛化之间的联系。 AI

影响 理解“grokking”现象可能通过识别关键数据属性,从而开发出更强大、更具泛化能力的AI模型。

排序理由 该集群包含一篇详细介绍机器学习新发现的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

机器学习中的“grokking”现象需要打破数据对称性来实现泛化

报道来源 [1]

  1. arXiv stat.ML TIER_1 English(EN) · Marcel Tom\`as Bernal, Neil Rohit Mallinar, Mikhail Belkin ·

    Breaking Data Symmetry is Needed For Generalization in Feature Learning Kernels

    arXiv:2604.00316v2 Announce Type: replace Abstract: Grokking occurs when a model achieves high training accuracy but generalization to unseen test points happens long after that. This phenomenon was initially observed on a class of algebraic problems, such as learning modular ari…