English(EN) Scaling and Optimizing Frontier Model Training

Fireworks AI 实现万亿参数 MoE 模型训练

作者 PulseAugur 编辑部 · [2 个来源] · 2026-05-18 19:53

Fireworks AI 开发了新的训练基础设施，能够微调万亿参数的混合专家（MoE）模型，克服了之前的内存和编排瓶颈。该平台在最近发布的 Cursor Composer 2.5 中发挥了关键作用，Composer 2.5 是一个在多个基准测试中取得顶尖性能的编码模型。该系统利用低精度专家量化和优化器状态卸载等技术来管理大型 MoE 模型内存需求，使其更容易进行训练和微调。 AI

影响能够训练万亿参数的 MoE 模型，可能加速更强大的前沿模型的开发。

排序理由 Fireworks AI 的博客文章详细介绍了其训练大型 MoE 模型的基础设施，该基础设施被用于训练 Cursor Composer 2.5。

在 Fireworks AI blog 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

X — Fireworks (inference infra) TIER_1 English(EN) · FireworksAI_HQ · 2026-05-18 19:53

The @cursor_ai 团队在同一款 Kimi K2.5 基础模型上发布了 Composer 2 和 Composer 2.5。性能基准测试📈。前沿质量和开源经济

The @cursor_ai team shipped Composer 2 and now Composer 2.5 on the same Kimi K2.5 base model. Performance benchmarks are📈. Frontier quality and open-source economics. 85% of the compute powering these gains came from RL. Fireworks powers the RL rollouts. Learn more about https:/…
Fireworks AI blog TIER_1 English(EN) · 2026-05-25 03:01

扩展和优化前沿模型训练

Fireworks Training SDK provides the model catalog, parallelism stack, precision kernels, and memory optimizations that make it possible to fine-tune trillion-parameter MoE models on current hardware.

报道来源 [2]

The @cursor_ai 团队在同一款 Kimi K2.5 基础模型上发布了 Composer 2 和 Composer 2.5。性能基准测试📈。前沿质量和开源经济

扩展和优化前沿模型训练

相关实体

相关话题