English(EN) GLM 5.2 Fast is live on Fireworks

Fireworks AI 发布更快的 GLM 5.2 以支持代理工作流

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 00:00

Fireworks AI 推出了 GLM 5.2 Fast，这是一款专为代理工作流设计的模型，其运行速度比标准版本快 2-3 倍。这种增强的速度对于处理大上下文、编写计划和使用工具的代理至关重要，使其更加实用且具成本效益。该模型支持 100 万个 token 的上下文窗口，并具有优化的提示缓存功能，为重复使用的上下文提供显著折扣，这是代理操作中的主要成本因素。GLM 5.2 Fast 采用了一种特殊的架构，结合了混合专家模型 (MoE) 和 DeepSeek 稀疏注意力与 IndexShare，从而通过将注意力集中在输入的最相关部分来高效处理长上下文。 AI

影响通过显著提高长上下文任务的处理速度和成本效益，加速了代理工作流。

排序理由来自前沿实验室 (Fireworks AI) 的模型发布，包含新的版本名称和性能声明。[lever_c_demoted from frontier_release: ic=1 ai=1.0]

在 Fireworks AI blog 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Fireworks AI blog TIER_1 English(EN) · 2026-06-30 00:00

GLM 5.2 Fast is live on Fireworks

Use state-of-the-art, open-source LLMs and image models at blazing fast speed, or fine-tune and deploy your own at no additional cost with Fireworks AI!

报道来源 [1]

GLM 5.2 Fast is live on Fireworks

相关实体

相关话题