NVIDIA 已开源 NeMo AutoModel,该工具旨在显著加速专家混合(MoE)AI 模型的微调。通过在现有的 Hugging Face Transformers v5 代码中添加一行导入,用户可以实现高达 3.7 倍的训练吞吐量提升,并将 GPU 内存使用量减少高达 32%。这种性能提升归功于专家并行、用于融合计算和通信的 DeepEP 以及用于内核加速的 Transformer Engine 等技术。 AI
影响 通过减少训练时间和资源需求,加速大型 MoE 模型的开发和部署。
排序理由 NVIDIA 发布了一个开源工具,该工具改进了现有的模型训练基础设施,而不是一个前沿的新模型或核心研究论文。
- GPU
- Hugging Face Transformers v5
- Mixture-of-Experts (MoE)
- NeMo AutoModel
- Nemotron 3 Nano 30B-A3B
- Nemotron 3 Ultra 550B A55B
- NVIDIA
- Qwen3-30B-A3B
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →