研究人员调查了机器学习中的“grokking”现象,即模型在训练中达到高准确率,但直到很久以后才能泛化到新数据。他们使用递归特征机(RFM)算法在代数任务上进行研究,发现泛化取决于打破训练数据集中特定的对称性。RFM算法似乎通过恢复数据中固有的不变性群作用来实现这一点,学习到的特征矩阵编码了该不变性群的元素,从而解释了对称性与泛化之间的联系。 AI
影响 理解“grokking”现象可能通过识别关键数据属性,从而开发出更强大、更具泛化能力的AI模型。
排序理由 该集群包含一篇详细介绍机器学习新发现的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →