PulseAugur
实时 18:10:04

Layerwise LQR 框架使用几何感知控制优化深度网络

研究人员开发了 Layerwise LQR (LLQR),一个用于深度学习模型的新优化框架。LLQR 将二阶优化方法(如牛顿法)重新表述为线性二次调节器问题。这种方法可以学习结构化的逆预处理器,在不计算完整曲率矩阵的情况下捕获全局层级动态。在 ResNetsTransformers 上的实验表明,LLQR 可以在计算开销极小的情况下提高优化速度和最终模型性能。 AI

影响 引入了一种新颖的优化技术,可以提高深度学习模型的训练效率和性能。

排序理由 介绍深度学习新颖优化框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Layerwise LQR 框架使用几何感知控制优化深度网络

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Simon Dufort-Labb\'e, Pierre-Luc Bacon, Razvan Pascanu, Simon Lacoste-Julien, Aristide Baratin ·

    Layerwise LQR for Geometry-Aware Optimization of Deep Networks

    arXiv:2605.04230v1 Announce Type: new Abstract: Geometry-aware optimizers such as Newton and natural gradient can improve conditioning in deep learning, but scalable variants such as K-FAC, Shampoo, and related preconditioners usually impose structural approximations early, often…