PulseAugur
实时 12:40:09
English(EN) NVIDIA's 550B finally lands: free to use, expensive to host

NVIDIA 发布免费的 550B Nemotron 3 Ultra 模型,需要数据中心进行托管

NVIDIA 发布了 Nemotron 3 Ultra,这是一个拥有 5500 亿参数的开放权重模型,采用了混合 Mamba-Attention 设计和一百万个 token 的上下文窗口。该模型权重在 OpenMDW-1.1 许可下免费提供,但自行托管需要大量数据中心级别的硬件,例如多块 H100H200 GPU。为了方便访问,NVIDIA 提供了一个兼容 OpenAI 协议的托管 API。 AI

影响 此次发布提供了一个强大的开放权重模型,但其苛刻的硬件要求凸显了自行托管大型 AI 系统所面临的持续挑战。

排序理由 NVIDIA Frontier-lab 模型发布,附带系统卡。[lever_c_demoted from frontier_release: ic=1 ai=1.0]

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. dev.to — LLM tag TIER_1 English(EN) · Creeta ·

    NVIDIA's 550B finally lands: free to use, expensive to host

    <p>NVIDIA shipped its biggest open-weight model yet, and the weights are free to download — but standing it up yourself is a datacenter project, not a weekend one.</p> <h2> Nemotron 3 Ultra: What Landed on June 4 </h2> <p>Nemotron 3 Ultra is a text-only, open-weight Mixture-of-Ex…