English(EN) Model Parallelism With Subnetwork Data Parallelism

新的SDP框架将模型训练内存使用量减少高达60%

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 04:00

研究人员开发了一种名为子网络数据并行（SDP）的新型分布式训练框架，以解决预训练大型神经网络的高内存需求和通信成本问题。SDP将模型划分为结构化子网络，这些子网络可以在工作节点之间进行训练，而无需交换激活值，从而显著降低了每个设备的内存使用量。该框架采用了反向和前向掩码技术，以及神经元或块级别的构建策略，以在FLOP匹配的设置中实现效率提升和性能改进。 AI

影响降低了训练大型模型的内存需求，可能使AI的开发和部署更加高效。

排序理由这是一篇详细介绍神经网络分布式训练新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Vaibhav Singh, Zafir Khalid, Pietro Cagnasso, Edouard Oyallon, Eugene Belilovsky · 2026-06-02 04:00

模型并行与子网络数据并行

arXiv:2507.09029v5 Announce Type: replace-cross Abstract: Pre-training large neural networks at scale imposes heavy memory demands on accelerators and often requires costly communication. We introduce Subnetwork Data Parallelism (SDP), a distributed training framework that partit…

报道来源 [1]

模型并行与子网络数据并行

相关实体

相关话题