PulseAugur
实时 22:49:26
English(EN) Decentralized SGD with Controlled Disagreement Finds Flatter Minima

新的去中心化AI训练方法找到更平坦的最小值,优于中心化SGD

研究人员开发了一种名为DSGD-AC的新型去中心化训练方法,该方法挑战了去中心化学习在本质上不如中心化方法这一观点。该方法使用自适应共识机制来管理共识误差,共识误差通常被认为对收敛和泛化有害。通过平衡图阻尼和曲率相关阻尼,DSGD-AC可以产生更强的损失包络惩罚,从而获得比标准去中心化甚至中心化SGD方法更平坦的解和更高的测试准确性。研究结果表明,共识误差可以在去中心化学习算法中作为一种有益的隐式正则化器。 AI

影响 引入了一种新颖的去中心化训练算法,可能会提高分布式AI系统的效率和性能。

排序理由 这是一篇详细介绍去中心化机器学习新算法的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的去中心化AI训练方法找到更平坦的最小值,优于中心化SGD

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Zesen Wang, Mikael Johansson ·

    Decentralized SGD with Controlled Disagreement Finds Flatter Minima

    arXiv:2602.02899v2 Announce Type: replace Abstract: Decentralized training is often regarded as inferior to centralized training because the consensus errors between workers are thought to undermine convergence and generalization. This work challenges this view by introducing dec…