中国人工智能公司 MiniMax 即将发布其 M3 大语言模型,该模型集成了定制稀疏注意力机制。据报道,该新模型将提供显著的速度提升,预填充速度比前代版本快 9.7 倍。 AI
影响 引入了一种新颖的稀疏注意力机制,可能显著加快 LLM 推理速度。
排序理由 MiniMax 发布 M3 LLM,附带系统卡。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →