MiniMax 发布了 MiniMax M3,这是一款开放权重的专家混合(Mixture-of-Experts)模型,拥有 100 万 token 的上下文窗口和原生多模态能力。该模型拥有 4280 亿总参数,每个 token 仅激活 230 亿参数,在 SWE-Bench Pro 上取得了 59.0% 的分数,使其成为开放权重模型中的有力竞争者。然而,运行 M3 需要大量的硬件资源,通常是拥有超过 200GB VRAM 的多 GPU 服务器,并且其社区许可证限制了未经单独协议的商业用途。 AI
影响 为开放权重模型在长上下文和多模态能力方面树立了新标杆,但硬件和许可限制了广泛采用的重大障碍。
排序理由 Frontier-lab 模型发布,附带系统卡。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →