PulseAugur
实时 16:01:21
English(EN) DeepSeekV4 1.6T Day 0 to Day 43 Performance Over Time - Huawei, GB300 NVL72, MI355X, B200

DeepSeekV4 展现出快速的性能提升,挑战顶级AI模型

拥有1.6万亿参数的DeepSeekV4模型在其发布后的43天内展现出显著的性能提升。早期基准测试表明,该模型在推理和编码等领域具有竞争力,甚至超越了GPT-4和Claude 3 Opus等成熟模型。该模型的开发得到了Huawei先进计算基础设施的支持,包括其GB300 NVL72和MI355X加速器,以及NVIDIA的B200 GPU,这表明了强大的软硬件协同作用。 AI

影响 DeepSeekV4的快速性能提升挑战了现有的前沿模型,并凸显了先进硬件对AI能力的影响。

排序理由 该集群讨论了一个新的前沿模型发布(DeepSeekV4)及其性能数据。[lever_c_demoted from frontier_release: ic=1 ai=1.0]

在 X — SemiAnalysis 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. X — SemiAnalysis TIER_1 English(EN) · SemiAnalysis_ ·

    DeepSeekV4 1.6T Day 0 to Day 43 Performance Over Time - Huawei, GB300 NVL72, MI355X, B200

    DeepSeekV4 1.6T Day 0 to Day 43 Performance Over Time - Huawei, GB300 NVL72, MI355X, B200 Day 0 Inference Performance on InferenceX 100x performance improvement in 26 Days Cost per Million Tokens Huawei 950DT Inference Trace Analysis https://t.co/FkJGWtMa3y