研究人员开发了SUPERBROWSER,一个模仿人类浏览行为的自主网页导航代理。该系统使用一个面向视觉的管道来识别交互式元素,并使用一个三部分组成的“大脑”进行战略和操作推理。在Mind2Web Hard基准测试中,该系统取得了89.47%的成功率,优于现有的开源浏览器代理基线。 AI
影响 为自主网页导航代理设定了新的基准,可能影响该领域未来的人工智能发展。
排序理由 该集群包含一篇详细介绍新AI模型及其在基准测试中表现的研究论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →