Fireworks AI 宣布大幅降低其 GLM-5.2 模型的成本,声称其比 Anthropic 的 Opus 4.7 便宜约 48%。该公司通过将 GLM-5.2 的缓存令牌价格降低 2 倍并推出零 KLD 的训练后版本来实现这一目标。Fireworks AI 表示,在标准化为 90% 的缓存命中率后,GLM-5.2 的每次会话成本为 1.12 美元,而 Opus 4.7 的每次会话成本为 2.14 美元。 AI
影响 此公告可能会迫使竞争对手降低类似推理服务的价格。
排序理由 这是来自特定 AI 基础设施提供商的成本比较和产品更新,而不是前沿模型发布或重大行业事件。
在 X — Fireworks (inference infra) 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →