PulseAugur
实时 07:10:37
English(EN) Muon learns balanced solutions in matrix factorization without slow saddle-to-saddle dynamics

Muon 优化器加速矩阵分解,绕过梯度下降的局限性

一篇新研究论文介绍 Muon 优化器,该优化器在矩阵分解任务中表现出比传统梯度下降更优的性能。Muon 避免了缓慢的鞍点到鞍点动力学,通过同时学习所有顶部模式来实现更快的收敛。它还以更高的学习率保持稳定性,并在优化过程中表现出不同的守恒量,从而能够通过定制的学习率计划在短短两步内实现快速对齐和近乎完美的收敛。 AI

影响 引入了一种可能导致机器学习模型训练更快的创新优化器。

排序理由 详细介绍机器学习新优化算法的研究论文。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

Muon 优化器加速矩阵分解,绕过梯度下降的局限性

报道来源 [2]

  1. arXiv cs.LG TIER_1 English(EN) · Mark Rhee, Jamie Simon, Dhruva Karkada ·

    Muon 在矩阵分解中学习平衡解,避免了缓慢的鞍点到鞍点动力学

    arXiv:2606.30509v1 Announce Type: new Abstract: Matrix factorization (i.e., problems of the form $\min_{\mathbf{P},\mathbf{Q}} \|\mathbf{M}^\star - \mathbf{P}^\top\mathbf{Q}\|_\mathrm{F}^2$) is a minimal learning problem that exhibits both nonlinear parameter dynamics and represe…

  2. arXiv cs.LG TIER_1 English(EN) · Dhruva Karkada ·

    Muon 在矩阵分解中学习平衡解,无需缓慢的鞍点到鞍点动力学

    Matrix factorization (i.e., problems of the form $\min_{\mathbf{P},\mathbf{Q}} \|\mathbf{M}^\star - \mathbf{P}^\top\mathbf{Q}\|_\mathrm{F}^2$) is a minimal learning problem that exhibits both nonlinear parameter dynamics and representation learning. In this setting, we study how …