NVIDIA 发布 Nemotron-3 Ultra 550B LLM 以实现高级推理

作者 PulseAugur 编辑部 · [5 个来源] · 2026-05-15 21:52

NVIDIA 发布了其 Nemotron-3 Ultra 550B 模型，这是一个专为高级推理和代理工作流设计的大型语言模型。该模型采用混合 LatentMoE 架构，结合了 Mamba-2 和注意力层，支持高达 100 万个 token 的上下文长度。它针对多步代理、长上下文分析和多语言推理等复杂任务进行了优化，其推理能力可通过聊天模板进行配置。 AI

影响为代理推理和长上下文处理设定了新的基准，有可能加速复杂的 AI 工作流。

排序理由来自前沿实验室 (NVIDIA) 的模型发布，包含系统卡详情。

在 Hugging Face Trending Models 阅读 →

AI 生成摘要 · Google Gemini · 来自 5 个来源。我们如何撰写摘要 →

NVIDIA 发布 Nemotron-3 Ultra 550B LLM 以实现高级推理

报道来源 [5]

Hugging Face Trending Models TIER_1 Italiano(IT) · nvidia · 2026-06-03 14:54

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4

text-generation · 196 downloads · 59 likes
Hugging Face Trending Models TIER_1 Italiano(IT) · nvidia · 2026-06-03 14:50

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16

text-generation · 384 downloads · 53 likes
Hugging Face Trending Models TIER_1 English(EN) · nvidia · 2026-05-15 21:52

nvidia/nemotron-3.5-asr-streaming-0.6b

automatic-speech-recognition · 225 downloads · 97 likes
r/LocalLLaMA TIER_1 English(EN) · /u/justdoitanddont · 2026-06-04 16:40

NVIDIA Nemotron 3 Ultra 发布。

<div class="md"><p>Not sure how much this is in the "local" world but interesting what they are putting out. </p> <p><a href="https://developer.nvidia.com/blog/nvidia-nemotron-3-ultra-powers-faster-more-efficient-reasoning-for-long-running-agents/">https:…
r/LocalLLaMA TIER_1 English(EN) · /u/jacek2023 · 2026-06-04 11:48

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16 · Hugging Face

<table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1twla1k/nvidianvidianemotron3ultra550ba55bbf16_hugging/"> <img alt="nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16 · Hugging Face" src="https://external-preview.redd.it/SYWPdNi10HCp2771NvLU21deO0yBffz9XcMeE5wwU…

报道来源 [5]

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16

nvidia/nemotron-3.5-asr-streaming-0.6b

NVIDIA Nemotron 3 Ultra 发布。

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16 · Hugging Face

相关实体

相关话题