Fireworks AI 宣布了其 GLM-5.2 模型的最新推理速度,达到了每秒 446 个 token。这比之前每秒 392 个 token 的速度有所提升。然而,该公司提醒说,这些数据应谨慎解读,因为它们基于中位数分析,个体每日表现可能有所不同。 AI
影响 此次性能更新可能为 GLM-5.2 模型的用户带来边际改进。
排序理由 这是对现有模型的性能更新,并非新发布或重大的行业事件。
在 X — Fireworks (inference infra) 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →