研究人员开发了 DASH,这是 Shampoo 优化器的一个显著更快的实现,用于机器学习。DASH 利用批处理块预处理来提高 GPU 利用率,并引入了牛顿-DB 和切比雪夫多项式近似等新方法来计算逆矩阵根。与现有的分布式 Shampoo 实现相比,这种优化使优化器步长速度提高了 5.6 倍,同时在每次迭代中也实现了更低的验证困惑度。 AI
影响 通过提高优化器效率来加速大型机器学习模型的训练。
排序理由 详细介绍优化机器学习算法新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →