English(EN) We heard your feedback. You want to go faster.

Fireworks AI推出GLM 5.2 Fast以提高推理速度 · 跟踪2个来源

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-30 19:29

Fireworks AI发布了GLM 5.2模型的更快版本，名为GLM 5.2 Fast。新版本在保持标准GLM 5.2相同质量的同时，实现了显著更高的推理速度，最高可达每秒140个token。该公司还强调了用于实现更高性能的定制部署选项，指出在Artificial Analysis上速度可达每秒446个token。 AI

影响提高LLM的推理速度，可能降低成本并改善实时应用程序性能。

排序理由前沿AI实验室的模型发布。[lever_c_demoted from frontier_release: ic=2 ai=1.0]

在 X — Fireworks (inference infra) 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

Fireworks AI推出GLM 5.2 Fast以提高推理速度 · 跟踪2个来源

报道来源 [2]

X — Fireworks (inference infra) TIER_1 English(EN) · FireworksAI_HQ · 2026-06-30 19:29

如需更高速度，请联系定制部署！

For even higher speeds, reach out for a custom deployment! We’ve hit 446 tok/s on Artificial Analysis. Learn more → https://t.co/rpFJ2dIZvX
X — Fireworks (inference infra) TIER_1 English(EN) · FireworksAI_HQ · 2026-06-30 19:29

我们听取了您的反馈。您希望更快。

We heard your feedback. You want to go faster. Introducing GLM 5.2 Fast The same model and quality as GLM 5.2 standard, now at 140 tok/s Flip one model ID → accounts/fireworks/routers/glm-5p2-fast https://t.co/jaYWA4lPi0

报道来源 [2]

如需更高速度，请联系定制部署！

我们听取了您的反馈。您希望更快。

相关实体

相关话题