WebVoyager: Building an end-to-end web agent with large multimodal models
PulseAugur coverage of WebVoyager: Building an end-to-end web agent with large multimodal models — every cluster mentioning WebVoyager: Building an end-to-end web agent with large multimodal models across labs, papers, and developer communities, ranked by signal.
-
DeepSeek寻求73.5亿美元创纪录融资;腾讯被视为投资者
人工智能公司DeepSeek据报道正寻求高达500亿元人民币(约合73.5亿美元)的首轮主要外部融资,这可能创下中国初创公司的新纪录。业内人士猜测腾讯比阿里巴巴更有可能参与,这表明科技巨头之间存在战略分歧。与此同时,腾讯AI部门的一名前高级研究员已加入OpenAI。
-
Smooth 和 ContextFort 提供 AI 代理的可视性和控制
Smooth 推出了新的无服务器浏览器代理 API,旨在提高可靠性、速度和成本效益,声称比现有解决方案便宜 7 倍,速度快 5 倍。该 API 通过处理即时浏览器启动和验证码解决等复杂问题,简化了开发人员的 Web 自动化任务。另外,ContextFort 推出了一个工具,为 Cursor 和 Claude Code 等 AI 编码代理提供可视性和控制,解决了代理访问开发人员机器上的敏感文件和凭据的安全问题。
-
OpenAI 推出 Operator,一款可浏览网页执行任务的 AI 代理
OpenAI 推出了 Operator,这是一款新推出的 AI 代理,旨在通过其自有浏览器与网站互动来执行基于网页的任务。该代理由一个名为 Computer-Using Agent (CUA) 的新模型驱动,可以通过打字、点击和滚动来填写表格、订购杂货等。Operator 最初作为一项研究预览向美国地区的 Pro 用户提供,目前正在集成到 ChatGPT 中,并将扩展到其他用户级别。该代理在网页交互基准测试中已展现出最先进的性能。