PulseAugur
实时 12:26:53
实体 Tilde Research

Tilde Research

PulseAugur coverage of Tilde Research — every cluster mentioning Tilde Research across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. RESEARCH · CL_28033 ·

    Tilde Research 发布 Aurora 优化器以解决 Muon 中的神经元死亡问题

    Tilde Research 推出了 Aurora,这是一种旨在更有效地训练神经网络的新型优化器。Aurora 解决了流行的 Muon 优化器中的一个关键问题,即在训练过程中大量神经元会永久失活。这个新的优化器在具有 1.1B 参数的预训练实验中得到了验证,在 modded-nanoGPT speedrun 基准测试中取得了最先进的性能,并且其代码已公开发布。

  2. RESEARCH · CL_24593 ·

    Aurora 优化器提升神经网络训练效率

    研究人员推出 Aurora,这是一种旨在改进大型神经网络训练的新优化器,特别适用于具有矩形矩阵的神经网络。Aurora 解决了现有优化器(如 Muon)在 MLP 层中可能出现的神经元死亡问题,尤其是在应用行归一化时。通过结合感知杠杆率和保持正交性,Aurora 展现出显著的数据效率,在开源互联网数据上实现了 100 倍的提升,并在通用评估中超越了更大的模型。该优化器被呈现为一个几乎没有开销的即插即用替代品,并且其代码已开源。