PulseAugur
实时 03:44:26
实体 Rustem Islamov

Rustem Islamov

PulseAugur coverage of Rustem Islamov — every cluster mentioning Rustem Islamov across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_117405 ·

    新理论解释深度学习中学习率预热的好处

    提出了一种关于深度学习中学习率预热的新理论视角,解释了其在改善训练方面的有效性。研究人员将 $(L_0, L_1)$-平滑条件推广,以基于损失次优性来约束局部曲率。该条件被常见的神经网络架构所满足,并能准确反映训练初期的优化景观。根据这种曲率调整学习率自然会导致预热计划,与固定学习率相比,可证明收敛速度更快,这在语言和视觉模型的实验中得到了证明。