Microsoft Research 开发了 Webwright,这是一个开源框架,允许 AI Agent 通过基于终端的方法与 Web 进行交互。与一次在一个浏览器中执行一步操作的传统 Agent 不同,Webwright Agent 在终端环境中编写和执行 Playwright 代码、bash 命令并检查日志。这种方法显著提高了性能,在 Odysseys 基准测试中取得了 60.1% 的成绩,远高于使用传统基于截图的 Agent 设置的基础 GPT-5.4 模型得分 33.5%。 AI
影响 通过采用以代码为中心的方法,使 AI Agent 能够更有效地执行复杂的 Web 任务,从而可能提高自动化和数据提取能力。
排序理由 该集群描述了 Microsoft Research 发布的一个用于 AI Agent 的新开源框架,包括基准测试结果。
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →