PulseAugur
实时 15:45:01
实体 Ibrahim Talha Ersoy

Ibrahim Talha Ersoy

PulseAugur coverage of Ibrahim Talha Ersoy — every cluster mentioning Ibrahim Talha Ersoy across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_96217 ·

    新理论通过 L2 相变解释深度神经网络中的领悟现象

    研究人员开发了一种新理论,解释了深度神经网络中“领悟”(grokking)现象,即模型在过拟合一段时间后突然开始泛化。这项发表在 arXiv 上的研究提出,领悟与一阶 L2 相变中的滞后现象有关。通过故意将模型困在亚稳态,研究人员证明了 SGD 噪声可以驱动它们越过能量壁垒,从而产生遵循阿伦尼乌斯缩放的逃逸时间,进而重现了领悟曲线。