Nvidia 的 GB300 ultra NVL72 在使用 vLLM 项目的引擎进行的推理任务中,展示了比 GB200 NVL72 快 2.7 倍的速度优势。这一性能飞跃超出了基于 GB300 规格的理论预期,其规格包括 NVFP4 FLOPs 和 HBM 容量增加 1.5 倍,同时 HBM 带宽与 GB200 相同。 AI
影响 这项硬件进步可能会加速 AI 模型的训练和推理,从而可能降低成本并支持更复杂的模型。
排序理由 宣布一款新的硬件产品(GB300 ultra NVL72),其性能比前代产品有显著提升。[lever_c_demoted from significant: ic=1 ai=0.7]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →