AI模型市场在定价和性能方面发生了重大转变,尤其是在SWE-bench等代码基准测试中。来自DeepSeek、Kimi和MiniMax等中国实验室的模型,以更低的成本提供了与Claude Opus和GPT-5等顶级模型相当甚至更优的性能。这一趋势归因于混合专家(Mixture-of-Experts)架构的进步、中国实验室因硬件限制而采取的成本优化策略,以及强化学习技术在代码领域的广泛应用。此外,非常低成本的缓存输入Token的出现,特别是来自Gemini 3.5 Flash,正在改变代理工作负载的经济性,而大型上下文窗口对于涉及广泛代码库的任务仍然是关键的差异化因素。 AI
影响 加速了成本效益型AI解决方案的趋势,给现有厂商带来压力,并使先进AI在编码任务中的应用更加广泛。
排序理由 文章详细介绍了AI模型市场的重大转变,强调了由特定模型和架构进步驱动的新定价和性能动态。[lever_c_demoted from significant: ic=1 ai=1.0]
- Claude Opus
- Claude Opus 4.7
- DeepSeek V4 Flash
- DeepSeek V4 Pro
- Gemini 3.1 Pro
- Gemini 3.5 Flash
- GPT-4
- GPT-5.2
- Kimi K2.6
- MiniMax M2.5
- Qwen3.6 Plus
- SWE-bench
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →