一款名为Reasonix的开源新工具被开发出来,旨在显著降低使用DeepSeek V4模型的成本,其缓存命中率高达99.82%。这项优化可以将处理4亿个token的成本从61美元降至12美元。Reasonix专为DeepSeek的缓存机制设计,采用追加式循环和缓存优先策略,以保持旧上下文的稳定性并最大限度地减少重新计算。该工具还包括修复工具调用和智能管理模型版本的功能,以进一步控制开销。 AI
影响 显著降低了DeepSeek V4用户的运营成本,并可能影响其他模型处理长上下文的方式。
排序理由 这是一个新的开源工具,用于优化现有模型,而不是新的模型发布或重大的行业性事件。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →