NVIDIA 发布了其 Nemotron 3 Ultra 大型语言模型,该模型采用 5500 亿参数的 MoE 架构,针对代理式 AI 工作负载进行了优化。该模型为需要对长上下文进行持续推理的任务提供了显著更快的推理速度和更低的成本。它现在可以在 Amazon SageMaker JumpStart 上一键部署,使企业能够构建复杂的 AI 代理。 AI
影响 通过在主要云平台上轻松获得专门的前沿模型,加速了先进代理式 AI 的部署。
排序理由 这是关于云平台上 LLM 的产品发布公告,而不是核心实验室发布的新前沿模型。
在 AWS Machine Learning Blog 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →