NVIDIA 发布了 Nemotron 3 Nano Omni,这是一款能够同时处理视觉、音频、视频和文本的多模态大型语言模型。该开放模型基于 Mamba2 Transformer 混合专家模型架构构建,旨在通过实现单一多模态理解推理循环来增强企业智能体工作流程。它现已在 Fireworks 和 Amazon SageMaker JumpStart 上提供,提供 131K 的上下文长度,并获得商业使用许可。 AI
影响 通过合并推理跳跃和编排逻辑,实现更高效、更集成的多模态 AI 智能体。
排序理由 NVIDIA 发布新的多模态 LLM,包含系统卡详情。
在 AWS Machine Learning Blog 阅读 →
- Amazon SageMaker JumpStart
- AWS
- Fireworks
- Mamba2
- Mixture of Experts
- Nemotron 3 Nano Omni
- NVIDIA
- Qwen3 30B
- Transformer
AI 生成摘要 · Google Gemini · 来自 5 个来源。 我们如何撰写摘要 →