Fireworks AI 推出了 MiniMax M3 模型,并将其作为 MiniMax 系列最快的端点提供。该新模型拥有 512K 上下文窗口,支持原生图像和视频输入,并通过 MSA 稀疏注意力在预填充和解码方面实现了显著的速度提升。MiniMax M3 的定价与其前代 M2.7 相当,并在 Artificial Analysis 指数上被评为顶级开源模型。 AI
影响 增强了 AI 应用的推理速度和多模态能力,可能降低用户成本。
排序理由 这是推理基础设施提供商的产品发布,而非核心 AI 实验室的前沿模型发布。
在 X — Fireworks (inference infra) 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →