Microsoft 发布了其 MAI-Thinking-1 模型,这是一个从头开始训练的通用和推理模型,没有经过第三方蒸馏。该模型在 AIME 2025 和 SWE-Bench Pro 等基准测试中取得了高分,并在针对现有模型的用户偏好测试中表现出色。Microsoft 还详细介绍了其用于将模型适应特定工作流程的“Frontier Tuning”方法,声称效率显著提高。 AI
影响 在推理和编码基准测试中设定了新的 SOTA,同时 Frontier Tuning 为高效、定制化的企业模型提供了途径。
排序理由 Microsoft 发布了新的 Frontier 模型 MAI-Thinking-1,并提供了详细的技术信息和基准测试结果。 [lever_c_demoted from frontier_release: ic=1 ai=1.0]
- AIME 2025
- Sonnet 4.6
- Frontier Tuning
- Gemma 4 12B
- GPT-5.4
- GPT-Image-2
- Ideogram 4.0
- MAI-Code-1-Flash
- MAI-Image-2.5
- MAI-Thinking-1
- Microsoft
- SWE-Bench Pro
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →