PulseAugur
实时 06:41:18
English(EN) GLM 5.2 Fast is live on Fireworks

Fireworks AI 发布更快的 GLM 5.2 以支持代理工作流

Fireworks AI 推出了 GLM 5.2 Fast,这是一款专为代理工作流设计的模型,其运行速度比标准版本快 2-3 倍。这种增强的速度对于处理大上下文、编写计划和使用工具的代理至关重要,使其更加实用且具成本效益。该模型支持 100 万个 token 的上下文窗口,并具有优化的提示缓存功能,为重复使用的上下文提供显著折扣,这是代理操作中的主要成本因素。GLM 5.2 Fast 采用了一种特殊的架构,结合了混合专家模型 (MoE) 和 DeepSeek 稀疏注意力与 IndexShare,从而通过将注意力集中在输入的最相关部分来高效处理长上下文。 AI

影响 通过显著提高长上下文任务的处理速度和成本效益,加速了代理工作流。

排序理由 来自前沿实验室 (Fireworks AI) 的模型发布,包含新的版本名称和性能声明。[lever_c_demoted from frontier_release: ic=1 ai=1.0]

在 Fireworks AI blog 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Fireworks AI 发布更快的 GLM 5.2 以支持代理工作流

报道来源 [1]

  1. Fireworks AI blog TIER_1 English(EN) ·

    GLM 5.2 Fast is live on Fireworks

    Use state-of-the-art, open-source LLMs and image models at blazing fast speed, or fine-tune and deploy your own at no additional cost with Fireworks AI!