一位开发者将Anthropic的Claude Opus 4.7的tool-search-tool与其自己的“Ratel”网关进行了基准测试,发现Ratel的效率显著更高。在180个工具的目录大小下,Ratel在保持接近的准确率的同时,将输入令牌减少了约81%,而Anthropic的tool-search-tool的准确率下降了约8.4个百分点。该开发者得出结论,大型上下文窗口和内置工具搜索并不等同于一个优化的网关来管理上下文输入。 AI
影响 突出了当前LLM工具集成中潜在的低效率,并为优化的网关解决方案提供了机会。
排序理由 这是对第三方工具性能与现有AI模型的特定功能进行的比较,而不是关于新模型发布或核心研究。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →