NVIDIA 发布了 Nemotron 3 Ultra,这是一个拥有 5500 亿参数的开放权重模型,采用了混合 Mamba-Attention 设计和一百万个 token 的上下文窗口。该模型权重在 OpenMDW-1.1 许可下免费提供,但自行托管需要大量数据中心级别的硬件,例如多块 H100 或 H200 GPU。为了方便访问,NVIDIA 提供了一个兼容 OpenAI 协议的托管 API。 AI
影响 此次发布提供了一个强大的开放权重模型,但其苛刻的硬件要求凸显了自行托管大型 AI 系统所面临的持续挑战。
排序理由 NVIDIA Frontier-lab 模型发布,附带系统卡。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →