MiniMax 发布了其 M3 模型,该模型拥有百万级(100万)上下文窗口和稀疏注意力架构。该设计显著加速了响应生成,据称速度提升超过15倍。M3 模型值得注意的是,它是一个开放权重模型,有效地结合了多模态能力和强大的工程特性。 AI
影响 在上下文窗口长度和多模态工程方面设定了新的 SOTA(State-of-the-Art)。
排序理由 MiniMax M3 模型发布,附带系统卡。[lever_c_降级自 frontier_release: ic=1 ai=1.0]
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →