Hessian Eigenvector Dynamics Reveal Optimizer Differences in Neural Network Training

By PulseAugur Editorial · [2 sources] · 2026-06-29 12:39

Researchers have analyzed the evolution of Hessian eigenvectors during neural network training, revealing distinct behaviors between different optimizers. The study found that SGD tends to stabilize leading curvature directions over time, while Adam shows significant reorganization of these eigenvectors. Additionally, Adam exhibits a localization phenomenon where a small set of parameters disproportionately influences the leading curvature. AI

IMPACT Provides deeper insights into how optimizers like SGD and Adam affect neural network training, potentially guiding future algorithm development.

RANK_REASON The cluster contains an academic paper detailing novel research findings on neural network training dynamics.

Read on arXiv cs.LG →

paper
other

AI-generated summary · Google Gemini · from 2 sources. How we write summaries →

Hessian Eigenvector Dynamics Reveal Optimizer Differences in Neural Network Training

COVERAGE [2]

arXiv cs.LG TIER_1 English(EN) · Marcelina Marjankowska, Valerio Modugno, Paolo Barucca · 2026-06-30 04:00

Characterizing Optimizer-Dependent Training Dynamics Through Hessian Eigenvector Displacement and Localization

arXiv:2606.30226v1 Announce Type: new Abstract: Hessian spectral properties are a standard tool in analysing neural-network training, with eigenvalues linked to sharpness, generalization, and optimization dynamics. Eigenvalues quantify curvature magnitude, while eigenvectors iden…
arXiv cs.LG TIER_1 English(EN) · Paolo Barucca · 2026-06-29 12:39

Characterizing Optimizer-Dependent Training Dynamics Through Hessian Eigenvector Displacement and Localization

Hessian spectral properties are a standard tool in analysing neural-network training, with eigenvalues linked to sharpness, generalization, and optimization dynamics. Eigenvalues quantify curvature magnitude, while eigenvectors identify which parameters generate that curvature. I…

COVERAGE [2]

Characterizing Optimizer-Dependent Training Dynamics Through Hessian Eigenvector Displacement and Localization

Characterizing Optimizer-Dependent Training Dynamics Through Hessian Eigenvector Displacement and Localization

RELATED ENTITIES

RELATED TOPICS