Anthropic 为其 Claude API 推出了一种新方法,通过按需加载工具模式,显著减少了 token 使用量并提高了准确性。以前,代理会在请求开始时加载所有可用的工具模式,随着工具数量的增加,这会导致 token 成本高昂和性能下降。新的延迟加载功能允许代理仅在任务需要时加载必要的模式,从而大大减少了上下文窗口的使用量,并增强了模型选择正确工具的能力。 AI
影响 通过优化工具模式加载,降低了 token 成本并提高了代理的准确性,有可能加速代理的采用。
排序理由 这描述了一个现有产品的新功能,而不是新的模型发布或基础研究。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →