PulseAugur
实时 15:43:52
实体 Arrhenius scaling

Arrhenius scaling

PulseAugur coverage of Arrhenius scaling — every cluster mentioning Arrhenius scaling across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_96217 ·

    新理论通过 L2 相变解释深度神经网络中的领悟现象

    研究人员开发了一种新理论,解释了深度神经网络中“领悟”(grokking)现象,即模型在过拟合一段时间后突然开始泛化。这项发表在 arXiv 上的研究提出,领悟与一阶 L2 相变中的滞后现象有关。通过故意将模型困在亚稳态,研究人员证明了 SGD 噪声可以驱动它们越过能量壁垒,从而产生遵循阿伦尼乌斯缩放的逃逸时间,进而重现了领悟曲线。