Fireworks AI 宣布了其 GLM-5.2 模型的成本节省,声称在 90% 缓存命中率的情况下,其成本比 Anthropic 的 Opus-4.7 低约 48%。该公司还表示,其平台现已与 EvoSkill v1.3.0 集成,允许用户在开放模型上进行快速推理。此次集成使 Fireworks AI 成为一流的提供商,与其他选项(如 Claude API 和 OpenRouter)并列。 AI
影响 通过 Fireworks AI 的平台使用开放模型,可能降低用户的推理成本。
排序理由 这是来自推理基础设施提供商的产品公告和成本比较,而不是前沿模型发布。
在 X — Fireworks (inference infra) 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →