English(EN) RT @dzhulgakov: you may have heard that glm-5.2 at 392 token/s is cool, how about 446

Fireworks AI 声称 GLM-5.2 推理速度提升至 446 tokens/秒

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-28 15:17

Fireworks AI 宣布了其 GLM-5.2 模型的最新推理速度，达到了每秒 446 个 token。这比之前每秒 392 个 token 的速度有所提升。然而，该公司提醒说，这些数据应谨慎解读，因为它们基于中位数分析，个体每日表现可能有所不同。 AI

影响此次性能更新可能为 GLM-5.2 模型的用户带来边际改进。

排序理由这是对现有模型的性能更新，并非新发布或重大的行业事件。

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

X — Fireworks (inference infra) TIER_1 English(EN) · FireworksAI_HQ · 2026-06-28 15:17

RT @dzhulgakov: you may have heard that glm-5.2 at 392 token/s is cool, how about 446

RT @dzhulgakov: you may have heard that glm-5.2 at 392 token/s is cool, how about 446 except… it’s all noise. Artificial Analysis picks me…