一项新的分析显示,使用 MCP(模型上下文协议)服务器的 AI 代理会产生显著的隐藏 Token 使用成本,可能比预期多消耗 10-32 倍的 Token。这种开销源于在每次对话轮次中注入 MCP 工具的完整定义,导致了巨大的财务成本,并因上下文窗口压力而降低了模型性能。文章提出了三种解决方案:实施 MCP Gateway 以按需加载工具;使用廉价的分类器进行语义工具路由,仅加载相关的模式;探索工具模式压缩以实现更高效的定义。 AI
影响 突显了 AI 代理开发和部署中一个重要但先前被低估的成本因素,推动了对更高效基础设施的需求。
排序理由 该条目是对 AI 代理技术问题的分析和解决方案,而非直接发布或公告。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →