小米发布了MiMo-v2.5-Pro,这是一款专注于编码的开源语言模型,在复杂任务中展现出令人印象深刻的能力。该模型在数小时内成功完成了一个大学级别的编译器项目,根据模糊的提示构建了一个功能齐全的视频编辑器应用程序,并解决了模拟电路设计问题。MiMo-v2.5-Pro在编码基准测试中表现强劲,可与GPT-5.4和Claude Opus 4.6等顶级闭源模型相媲美,现已在HuggingFace上发布。 AI
影响 为开源编码模型设定了新的SOTA;迫使闭源模型匹配其代理和长时程能力。
排序理由 大型科技公司的开源模型发布,其基准测试结果可与前沿模型竞争。
在 Mastodon — mastodon.social 阅读 →
- Claude Opus 4.6
- Claude Sonnet 4.6
- Claw-Eval
- DeepSeek V4 Pro
- GDPVal-AA
- Gemini
- GPT-5.4
- MiMo-v2.5-Pro
- MiMo-V2-Flash
- Peking University
- Rust
- SysY
- Xiaomi
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →