PulseAugur
实时 13:22:03

研究人员开发了用于高效多类别交叉熵的快速高斯-牛顿法

研究人员开发了一种快速高斯-牛顿(FGN)方法来近似多类别交叉熵的广义高斯-牛顿(GGN)曲率。这种新方法将标准的GGN分解为一个真值与其余项和一个正半定竞争者内部协方差项,并舍弃后者以创建一种高效的低估近似。FGN方法对于二元分类是精确的,并且可以使用无矩阵共轭梯度方法高效求解,有望扩大训练规模。 AI

影响 为具有许多类别的深度学习模型的训练引入了更有效的近似方法,可能加快收敛速度。

排序理由 详细介绍多类别交叉熵新算法近似的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

研究人员开发了用于高效多类别交叉熵的快速高斯-牛顿法

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Mikalai Korbit, Mario Zanon ·

    用于多类别交叉熵的快速高斯-牛顿法

    arXiv:2605.06081v1 Announce Type: new Abstract: In multiclass softmax cross-entropy, the full generalized Gauss-Newton (GGN) curvature couples all output logits through the softmax covariance, making curvature-vector products harder to scale as the number of classes grows. We sho…