一款名为routeproof的新工具已被开发出来,用于测试AI模型路由到特定工具的可靠性。当针对@modelcontextprotocol/server-filesystem参考实现进行测试时,routeproof揭示了AI模型的工具选择不是确定的,即使输入相同,结果也会有所不同。该工具发现了一个特定问题,即`list_allowed_directories`函数在文件读取和目录树请求时被错误调用,尽管其描述不包含这些功能。开发者最初预测已弃用的`read_file`工具将是错误的根源,但这一预测被证明是错误的,凸显了路由故障的微妙性。 AI
影响 该工具通过识别和修复工具选择中的路由错误,可以提高AI代理的可靠性。
排序理由 该条目描述了一个用于测试AI路由的新工具,而不是一个核心AI模型发布或研究。
- directory_tree
- list_allowed_directories
- list_directory_with_sizes
- @modelcontextprotocol/server-filesystem
- move_file
- read_file
- read_media_file
- read_text_file
- routeproof
- search_files
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →