Layerwise LQR 框架使用几何感知控制优化深度网络

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-07 04:00

研究人员开发了 Layerwise LQR (LLQR)，一个用于深度学习模型的新优化框架。LLQR 将二阶优化方法（如牛顿法）重新表述为线性二次调节器问题。这种方法可以学习结构化的逆预处理器，在不计算完整曲率矩阵的情况下捕获全局层级动态。在 ResNets 和 Transformers 上的实验表明，LLQR 可以在计算开销极小的情况下提高优化速度和最终模型性能。 AI

影响引入了一种新颖的优化技术，可以提高深度学习模型的训练效率和性能。

排序理由介绍深度学习新颖优化框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Simon Dufort-Labb\'e, Pierre-Luc Bacon, Razvan Pascanu, Simon Lacoste-Julien, Aristide Baratin · 2026-05-07 04:00

Layerwise LQR for Geometry-Aware Optimization of Deep Networks

arXiv:2605.04230v1 Announce Type: new Abstract: Geometry-aware optimizers such as Newton and natural gradient can improve conditioning in deep learning, but scalable variants such as K-FAC, Shampoo, and related preconditioners usually impose structural approximations early, often…

报道来源 [1]

Layerwise LQR for Geometry-Aware Optimization of Deep Networks

相关实体

相关话题