Moonshot AI 发布了 Kimi K2.6,这是一个拥有 1 万亿参数的开放权重编码模型,在 SWE-Bench Pro 基准测试中表现优于 GPT-5.4。该模型专为代理任务设计,支持 262,144 个 token 的上下文窗口,并具备多模态能力,包括文本、图像,并即将支持视频。Kimi K2.6 在修改后的 MIT 许可下提供,该许可允许在一定阈值内的商业用途,使其成为与许可限制更严格的其他模型相比,企业的一个有竞争力的选择。 AI
影响 为编码模型树立了新标准,为代理任务提供了经济高效且高性能的替代方案。
排序理由 新的前沿模型发布,附带系统卡和基准测试结果。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
- Claude Opus 4.6
- Claude Opus 4.7
- DeepInfra
- Devstral
- GPT-5.4
- Kimi K2.6
- Llama 3
- Moonshot AI
- Ollama
- OpenRouter
- Open WebUI
- Qwen2.5-Coder
- SWE-Bench Pro
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →