实体
Muon optimizer
Muon optimizer
PulseAugur coverage of Muon optimizer — every cluster mentioning Muon optimizer across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新的优化器 AMUSE、MiMuon 和 Pion 增强深度学习训练
研究人员开发了几种新的优化技术来改进深度学习模型的训练。AMUSE 将 Muon 的快速适应性与无计划平均的稳定性相结合,无需学习率计划即可提高视觉和语言任务的性能。另一种方法 MiMuon 通过将其与 SGD 融合来增强 Muon 的泛化能力,提供更低的泛化误差。此外,一种名为 Pion 的新优化器通过采用频谱高通滤波机制,解决了 Muon 在视觉-语言-动作和强化学习中的局限性。
-
Qwen 发布 27B 多模态模型,用于高级编码
Qwen 发布了 Qwen3.6-27B,这是一个拥有 270 亿参数的密集多模态模型,专为高级编码任务设计。该模型旨在提供旗舰级的智能体编码性能,超越了此前该类别中的开源模型。社区成员已经发布了 Qwen3.6-27B 的不同量化版本,可在 Hugging Face 上获取,方便其在不同平台和库中使用。