MiniMax发布了其M3模型,据称与前代模型相比,每token的计算量显著降低。该公司声称,新模型在预填充阶段速度提升9倍,在解码阶段速度提升15倍,同时支持一百万token的上下文窗口。 AI
影响 此次发布表明大型语言模型推理效率的显著提升,可能降低成本并支持具有更大上下文窗口的新应用。
排序理由 MiniMax M3模型发布,附带系统卡。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →