PulseAugur
实时 10:15:22
实体 Net2Net

Net2Net

PulseAugur coverage of Net2Net — every cluster mentioning Net2Net across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_122953 ·

    新研究详细介绍了扩展神经网络模型的原则性方法

    一篇新研究论文提出了一种有效扩展神经网络模型的方法,允许从已训练好的小型模型初始化大型模型。该方法受 $\mu$P 和无限宽度架构的启发,使用理论上可靠的、与宽度相关的扰动噪声和优化器超参数缩放。该方法旨在通过减少对扩展版本进行昂贵超参数调优的需求来加速大型模型的收敛,并在实际数据集和架构上证明了其有效性。