English(EN) Reinforcement Learning for Computer-Use Agents with Autonomous Evaluation

新的强化学习框架使用视觉语言模型进行图形用户界面代理监督

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-23 12:46

研究人员开发了一种新的计算机使用代理（CUA）强化学习框架，该框架利用自主视觉语言评估进行监督。通过使用视觉语言模型根据最终屏幕截图和指令判断任务完成情况，该方法解决了在开放式桌面环境中获取可扩展奖励信号的挑战。该框架将评估者的反馈建模为嘈杂的二元奖励通道，并使用经过噪声校正的奖励估计器进行近端策略优化，从而在各种模拟环境中成功率得到显著提高。 AI

影响这项研究可以实现更强大的 AI 代理，这些代理能够自主学习在图形用户界面中执行复杂任务。

排序理由该集群包含一篇详细介绍 AI 代理强化学习新方法的论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Marta Sumyk, Oleksandr Kosovan · 2026-06-24 04:00

Reinforcement Learning for Computer-Use Agents with Autonomous Evaluation

arXiv:2606.24515v1 Announce Type: new Abstract: Computer-Use Agents (CUAs) execute high-level user goals by perceiving and acting directly within graphical user interfaces. However, reinforcement learning for CUAs remains difficult because open-ended desktop environments rarely p…
arXiv cs.AI TIER_1 English(EN) · Oleksandr Kosovan · 2026-06-23 12:46

Reinforcement Learning for Computer-Use Agents with Autonomous Evaluation

Computer-Use Agents (CUAs) execute high-level user goals by perceiving and acting directly within graphical user interfaces. However, reinforcement learning for CUAs remains difficult because open-ended desktop environments rarely provide scalable, machine-readable reward signals…

报道来源 [2]

Reinforcement Learning for Computer-Use Agents with Autonomous Evaluation

Reinforcement Learning for Computer-Use Agents with Autonomous Evaluation

相关实体

相关话题