English(EN) Nemotron 3 Ultra: How NVIDIA Built a 550B Open Model That Runs Faster Than Its Smaller Rivals

NVIDIA 发布 Nemotron 3 Ultra，一个 550B 参数的开源模型

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-19 16:15

NVIDIA 发布了 Nemotron 3 Ultra，一个拥有 5500 亿参数的开源模型，其推理速度比许多小型竞争对手更快。这种性能归功于一种结合了 Mamba 状态空间层和 Transformer 注意力的混合架构，该架构缓解了长上下文记忆瓶颈。该模型还采用了具有 512 个专家（每个 token 仅激活 22 个）的 LatentMoE 设计，并结合了多 token 预测以实现原生投机解码。 AI

影响该模型的混合架构可能会影响未来大型模型的设计，特别是在需要长上下文的代理任务方面。

排序理由前沿实验室模型发布，附带系统卡。[lever_c_降级自 frontier_release: ic=1 ai=1.0]

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

NVIDIA 发布 Nemotron 3 Ultra，一个 550B 参数的开源模型

报道来源 [1]

dev.to — LLM tag TIER_1 English(EN) · Prabhakar Chaudhary · 2026-06-19 16:15

Nemotron 3 Ultra: How NVIDIA Built a 550B Open Model That Runs Faster Than Its Smaller Rivals

<h1> Nemotron 3 Ultra: How NVIDIA Built a 550B Open Model That Runs Faster Than Its Smaller Rivals </h1> <p>NVIDIA's Nemotron 3 Ultra, released on June 4, 2026, is a 550-billion-parameter open model that manages to outrun several competing models with far fewer active parameters …

报道来源 [1]

Nemotron 3 Ultra: How NVIDIA Built a 550B Open Model That Runs Faster Than Its Smaller Rivals

相关实体

相关话题