拥有1.6万亿参数的DeepSeekV4模型在其发布后的43天内展现出显著的性能提升。早期基准测试表明,该模型在推理和编码等领域具有竞争力,甚至超越了GPT-4和Claude 3 Opus等成熟模型。该模型的开发得到了Huawei先进计算基础设施的支持,包括其GB300 NVL72和MI355X加速器,以及NVIDIA的B200 GPU,这表明了强大的软硬件协同作用。 AI
影响 DeepSeekV4的快速性能提升挑战了现有的前沿模型,并凸显了先进硬件对AI能力的影响。
排序理由 该集群讨论了一个新的前沿模型发布(DeepSeekV4)及其性能数据。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →