DeepSeek发布了V3-0324,一个开源编码模型,在编码性能上可媲美甚至超越GPT-4o和Claude 3.5 Sonnet等领先模型。该模型采用混合专家(Mixture-of-Experts)架构,拥有6710亿总参数和370亿激活参数,可显著节省推理成本。该模型支持128K token上下文窗口,并通过兼容OpenAI的API提供,便于开发者集成。 AI
影响 为编码任务提供了经济高效、高性能的开源替代方案,可能影响企业采用和研究。
排序理由 重要AI实验室发布的开源模型,其基准性能可与前沿模型竞争。[lever_c_demoted from frontier_release: ic=2 ai=1.0]
- Anthropic
- Claude 3.5 Sonnet
- Claude Opus 4.x
- DeepSeek
- DeepSeek-R1
- DeepSeek-V3-0324
- Effloow Lab
- GPT-4o
- GPT-5.x
- Mixture-of-Experts
- OpenAI
- Python
- SWE-bench
- V3-0324
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →