PulseAugur
实时 13:54:25

新方法提高了神经网络训练算法的效率

研究人员开发了一种新方法来重新参数化 ShampooSOAP 算法,提高了它们训练神经网络的效率。该技术支持 BFloat16 存储,从而减少内存使用量,并缓解了与此存储格式相关的性能下降。通过仅更新基向量的子空间,该方法显著降低了计算开销,使得基于 Shampoo 的方法在时间和内存方面更有效率,尤其适用于大型预处理矩阵。 AI

影响 提高了神经网络训练的效率,可能支持更大的模型或更快的迭代周期。

排序理由 该集群包含一篇详细介绍神经网络训练新算法改进的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新方法提高了神经网络训练算法的效率

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Alan Milligan, Zikun Xu, Simon Lacoste-Julien, Felix Dangel, Wu Lin ·

    重参数化洗发水和SOAP以进行子空间基更新和BFloat16存储

    arXiv:2605.26327v1 Announce Type: new Abstract: Shampoo-based methods, such as KL-Shampoo and SOAP, have demonstrated strong performance in training neural networks and rely on QR decomposition. Because existing QR implementations require single-precision (FP32) arithmetic and re…