MiniMax 发布了其 M2.5 模型,该模型现已开源,并使用强化学习进行训练,可用于编码和工具使用等任务。该公司强调其成本效益,声称其运行成本为每小时 1 美元,速度为每秒 100 个 token,使得自托管成为可能。此次发布还包括了其“Forge”强化学习训练系统的详细信息,早期用户反馈表明,尽管该模型对 token 需求量大,但适用于多轮交互。 AI
排序理由 来自非前沿实验室的开源模型发布,并附有基准测试结果。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →