NVIDIA 发布了 NeMo AutoModel,这是一个集成在其 NeMo 框架中的开源库,旨在显著加速大型专家混合(MoE)AI 模型的微调。该新工具基于 Hugging Face 的 Transformers v5,通过集成专家并行和 TransformerEngine 内核等高级功能。与标准的 Transformers v5 相比,该集成可将训练吞吐量提高高达 3.7 倍,并将 GPU 内存使用量减少 32%,同时保持熟悉的 `from_pretrained()` API 以方便使用。 AI
影响 加速大型 AI 模型的微调,可能降低研究人员和开发者的成本和时间。
排序理由 这是一个增强现有框架的库发布,而不是来自前沿实验室的新模型发布。
- Expert Parallelism
- Hugging Face
- NeMo AutoModel
- Nemotron 3 Nano 30B
- NVIDIA
- NVIDIA NeMo
- NVIDIA Nemotron 3 Ultra 550B
- PyTorch
- Qwen3 30B
- SGLang
- TransformerEngine
- Transformers
- vLLM
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →