研究人员开发了 GAIA,一个数据飞轮系统,旨在通过训练直观批评模型 (ICM) 来提高 GUI 代理的性能。该 ICM 评估代理操作的正确性,选择成功概率更高的操作。然后,系统使用此批评模型收集精炼数据,进而训练出更强大的批评模型,形成一个自我改进的循环。实验表明,这种迭代过程提高了各种 GUI 代理的测试时性能。 AI
影响 这项研究通过批评模型的迭代自我改进,有望实现更可靠、更强大的 GUI 代理。
排序理由 该集群包含一篇学术论文,详细介绍了用于训练 AI 模型的新系统和方法。 [lever_c_demoted from research: ic=1 ai=1.0]
- arXiv
- GUI agents
- Hugging Face
- Intuitive Critic Model
- Large Vision-Language Models
- Shaoje Zhang
- test-time scaling
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →