Nvidia 发布了其 Vera Rubin NVL72 GPU,承诺与 Blackwell 架构相比,每个 Token 的成本可降低高达 10 倍。然而,这种显著的成本节省取决于几个因素,包括使用新的 NVFP4 格式和特定的专家混合模型,并且基准测试是在完整机架规模下进行的。实际部署时间也带来了挑战,因为该硬件计划于 2026 年下半年发货,广泛可用性将延长至 2027 年,这可能与即时预算规划不符。 AI
影响 Vera Rubin NVL72 GPU 显著降低 Token 成本的潜力可能会重塑 AI 基础设施的经济性,但实现这些节省需要大量的量化工程努力,并仔细考虑部署时间。
排序理由 一款具有显著性能和成本声明的新 GPU 架构的发布,在 CES 和 GTC 等行业活动中进行了详细介绍,这被认为是一项重要的行业发展。[lever_c_demoted from significant: ic=1 ai=0.7]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →