PulseAugur
实时 11:42:06
English(EN) Model Parallelism With Subnetwork Data Parallelism

新的SDP框架将模型训练内存使用量减少高达60%

研究人员开发了一种名为子网络数据并行(SDP)的新型分布式训练框架,以解决预训练大型神经网络的高内存需求和通信成本问题。SDP将模型划分为结构化子网络,这些子网络可以在工作节点之间进行训练,而无需交换激活值,从而显著降低了每个设备的内存使用量。该框架采用了反向和前向掩码技术,以及神经元或块级别的构建策略,以在FLOP匹配的设置中实现效率提升和性能改进。 AI

影响 降低了训练大型模型的内存需求,可能使AI的开发和部署更加高效。

排序理由 这是一篇详细介绍神经网络分布式训练新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Vaibhav Singh, Zafir Khalid, Pietro Cagnasso, Edouard Oyallon, Eugene Belilovsky ·

    Model Parallelism With Subnetwork Data Parallelism

    arXiv:2507.09029v5 Announce Type: replace-cross Abstract: Pre-training large neural networks at scale imposes heavy memory demands on accelerators and often requires costly communication. We introduce Subnetwork Data Parallelism (SDP), a distributed training framework that partit…