NVIDIA推出了一种名为NVFP4的新型4位预训练方法,旨在显著降低训练大型AI模型的成本和能耗。该技术在拥有120亿参数、使用10万亿token的模型上进行了验证,目标是保持与更高精度方法相当的准确性。该公司预计,到2026年,这一发展将使AI模型训练成本降低75%。 AI
影响 NVIDIA的NVFP4方法可能会大大降低训练大型AI模型的门槛,从而加速该领域的创新。
排序理由 该集群描述了一种新方法及其对AI训练成本的潜在影响,属于AI基础设施的研究与开发范畴。
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →