Fireworks AI 推出了 Serverless 2.0,通过单一 API 引入了三个不同的服务层级,无需预留容量。新层级包括用于通用用途的“Standard”,用于高负载期间增强准入的“Priority”,以及用于优化高吞吐量推理的“Fast”。此次更新旨在为用户提供对推理行为和成本效益的更多控制,满足从原型设计到高速代理应用程序的各种生产需求。 AI
影响 为开发者提供对 AI 模型推理服务和成本更精细化的控制。
排序理由 AI 基础设施提供商的产品更新。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →