研究人员推出了 MiniMax-M2 系列,这是一系列专为代理部署设计的新型专家混合(Mixture-of-Experts)语言模型。旗舰 M2 模型拥有 2299 亿个总参数,但每个 token 仅激活 98 亿个,强调了效率。该系列建立在由代理驱动的数据管道、一个名为 Forge 的可扩展的代理原生强化学习系统以及一个(M2.7)检查点之上,该检查点通过调试训练运行展示了早期自我进化的能力。MiniMax-M2 系列在各种代理基准测试中取得了前沿水平的性能,包括编码、深度搜索和办公任务。 AI
影响 引入了一种专注于效率和代理能力的新模型架构,可能影响未来用于专业任务的 LLM 开发。
排序理由 该集群描述了一篇介绍新型语言模型系列的研究论文。
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →