DeepSeek V4 是一个开放权重模型系列,已发布,采用 1.6 万亿参数的专家混合(MoE)架构,每个 token 只激活 490 亿参数。该新模型拥有 100 万 token 的上下文窗口,并显著降低了推理成本,由于混合注意力(Hybrid Attention)等创新,成本比前代产品降低高达 73%。V4 系列可在 Hugging Face 上获取,其质量可与 GPT-5.4 和 Claude Opus 4.6 等领先模型相媲美,但价格却低得多,并且针对 NVIDIA Blackwell 进行了硬件性能优化。 AI
影响 为大型 MoE 模型树立了新的效率标准,使开发人员能够更轻松、更经济地获得先进的 AI 功能。
排序理由 DeepSeek(一家重要的 AI 实验室)发布了新模型,并提供了详细的技术规格和基准测试比较。
- DeepSeek V4
- KV-cache
- Claude Opus 4.6
- Crazyrouter
- GPT-5.4
- Hugging Face
- Kong API Gateway
- NVIDIA Blackwell
- ServerMO
- vLLM
- WekaFS
AI 生成摘要 · Google Gemini · 来自 4 个来源。 我们如何撰写摘要 →