PulseAugur
实时 08:20:28
English(EN) Curvature-Weighted Gradient Diversity: A Noise Measure for Geometry-Adaptive SGD Schedules

新指标 CWGD 改进了机器学习中的优化噪声测量

研究人员引入了曲率加权梯度多样性 (CWGD),这是一种旨在更好地测量机器学习模型中优化噪声的新颖指标。与将所有参数方向同等对待的传统方法不同,CWGD 考虑了曲率的影响,认识到高曲率方向对噪声不敏感。这种新度量在 CWGD-Cosine 学习率计划中使用时,与二次设置中的标准余弦退火相比,在优化最终误差方面有约 20% 的降低潜力,而开销可忽略不计。 AI

影响 这项新指标可以通过更好地管理学习率,从而提高机器学习模型的训练效率。

排序理由 该集群包含一篇详细介绍机器学习优化新指标和算法的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新指标 CWGD 改进了机器学习中的优化噪声测量

报道来源 [2]

  1. arXiv stat.ML TIER_1 English(EN) · Muhammad Hamza (Indian Institute of Technology Kharagpur), Ayush Goel (Indian Institute of Technology Kharagpur) ·

    Curvature-Weighted Gradient Diversity: A Noise Measure for Geometry-Adaptive SGD Schedules

    arXiv:2606.30455v1 Announce Type: cross Abstract: The standard convergence analysis of mini-batch stochastic gradient descent (SGD) models gradient noise using a single variance term that treats all parameter directions equally, ignoring the fact that noise in high-curvature dire…

  2. arXiv stat.ML TIER_1 English(EN) · Ayush Goel ·

    Curvature-Weighted Gradient Diversity: A Noise Measure for Geometry-Adaptive SGD Schedules

    The standard convergence analysis of mini-batch stochastic gradient descent (SGD) models gradient noise using a single variance term that treats all parameter directions equally, ignoring the fact that noise in high-curvature directions has less impact because learning rates are …