PulseAugur
实时 14:52:09
English(EN) MiniMax-M2.5: SOTA coding, search, toolcalls, $1/hour

MiniMax M2.5 开源原生智能体强化学习模型,编码能力可与 Sonnet 媲美

MiniMax 发布了其 M2.5 模型,该模型现已开源,并使用强化学习进行训练,可用于编码和工具使用等任务。该公司强调其成本效益,声称其运行成本为每小时 1 美元,速度为每秒 100 个 token,使得自托管成为可能。此次发布还包括了其“Forge”强化学习训练系统的详细信息,早期用户反馈表明,尽管该模型对 token 需求量大,但适用于多轮交互。 AI

排序理由 来自非前沿实验室的开源模型发布,并附有基准测试结果。

在 Smol AINews 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

MiniMax M2.5 开源原生智能体强化学习模型,编码能力可与 Sonnet 媲美

报道来源 [1]

  1. Smol AINews TIER_1 English(EN) ·

    MiniMax-M2.5: SOTA coding, search, toolcalls, $1/hour

    **MiniMax-M2.5** is now open source, featuring an "agent-native" reinforcement learning framework called **Forge** trained across **200k+ RL environments** for coding, tool use, and workflows. It boasts strong benchmark scores like **80.2% SWE-Bench Verified** and emphasizes cost…