PulseAugur
实时 13:32:44
English(EN) Cache-Aware Spawning: What Changed in llm-cli-gateway, a Week On

llm-cli-gateway 为 Claude、Gemini、Grok、Mistral 添加缓存

llm-cli-gateway 工具已更新至 1.6.0 版本,为 ClaudeCodexGeminiGrokMistral Vibe 五个 LLM 提供商引入了缓存感知生成。此功能通过利用每个提供商的缓存机制来优化成本,防止对相同提示进行重复处理。此次更新还引入了新的 `promptParts` 结构以实现更具组织性的提示管理,并提供聚合缓存统计信息。 AI

影响 通过利用提供商特定的缓存机制来优化 LLM API 使用成本。

排序理由 对集成多个 LLM API 的命令行工具的软件更新。

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. dev.to — LLM tag TIER_1 English(EN) · Werner Kasselman ·

    Cache-Aware Spawning:llm-cli-gateway 一周后的变化

    <p>If your multi-LLM workload sends the same long system prompt or file dump to Claude / Codex / Gemini ten times an hour, you are paying for the same input tokens ten times. Each provider has a cache for exactly this case, and each one expresses the cache differently. This post …