PulseAugur
实时 17:33:39
English(EN) RT @dzhulgakov: you may have heard that glm-5.2 at 392 token/s is cool, how about 446

Fireworks AI 声称 GLM-5.2 推理速度提升至 446 tokens/秒

Fireworks AI 宣布了其 GLM-5.2 模型的最新推理速度,达到了每秒 446 个 token。这比之前每秒 392 个 token 的速度有所提升。然而,该公司提醒说,这些数据应谨慎解读,因为它们基于中位数分析,个体每日表现可能有所不同。 AI

影响 此次性能更新可能为 GLM-5.2 模型的用户带来边际改进。

排序理由 这是对现有模型的性能更新,并非新发布或重大的行业事件。

在 X — Fireworks (inference infra) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Fireworks AI 声称 GLM-5.2 推理速度提升至 446 tokens/秒

报道来源 [1]

  1. X — Fireworks (inference infra) TIER_1 English(EN) · FireworksAI_HQ ·

    RT @dzhulgakov: you may have heard that glm-5.2 at 392 token/s is cool, how about 446

    RT @dzhulgakov: you may have heard that glm-5.2 at 392 token/s is cool, how about 446 except… it’s all noise. Artificial Analysis picks me…