PulseAugur
实时 18:09:28
English(EN) Scaling and Optimizing Frontier Model Training

Fireworks AI 实现万亿参数 MoE 模型训练

Fireworks AI 开发了新的训练基础设施,能够微调万亿参数的混合专家(MoE)模型,克服了之前的内存和编排瓶颈。该平台在最近发布的 Cursor Composer 2.5 中发挥了关键作用,Composer 2.5 是一个在多个基准测试中取得顶尖性能的编码模型。该系统利用低精度专家量化和优化器状态卸载等技术来管理大型 MoE 模型内存需求,使其更容易进行训练和微调。 AI

影响 能够训练万亿参数的 MoE 模型,可能加速更强大的前沿模型的开发。

排序理由 Fireworks AI 的博客文章详细介绍了其训练大型 MoE 模型的基础设施,该基础设施被用于训练 Cursor Composer 2.5。

在 Fireworks AI blog 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

Fireworks AI 实现万亿参数 MoE 模型训练

报道来源 [2]

  1. X — Fireworks (inference infra) TIER_1 English(EN) · FireworksAI_HQ ·

    The @cursor_ai 团队在同一款 Kimi K2.5 基础模型上发布了 Composer 2 和 Composer 2.5。性能基准测试📈。前沿质量和开源经济

    The @cursor_ai team shipped Composer 2 and now Composer 2.5 on the same Kimi K2.5 base model. Performance benchmarks are📈. Frontier quality and open-source economics. 85% of the compute powering these gains came from RL. Fireworks powers the RL rollouts. Learn more about https:/…

  2. Fireworks AI blog TIER_1 English(EN) ·

    扩展和优化前沿模型训练

    Fireworks Training SDK provides the model catalog, parallelism stack, precision kernels, and memory optimizations that make it possible to fine-tune trillion-parameter MoE models on current hardware.