PulseAugur
实时 13:40:19
实体 Gradient Smoothing

Gradient Smoothing

PulseAugur coverage of Gradient Smoothing — every cluster mentioning Gradient Smoothing across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_119484 ·

    新的梯度平滑方法增强了深度神经网络的优化

    研究人员引入了一种名为深度层梯度增强的新优化范式,旨在改进具有Transformer等重复架构块的深度神经网络的训练。这种方法称为梯度平滑,通过考虑深度维度来转换层更新,从而在包括语言模型预训练和扩散建模在内的各种任务中获得更好的优化和泛化性能。该方法与现有优化器兼容,计算开销极小,促进了更结构化的表示演化。