复旦大学和通义实验室的研究人员开发了ToolCUA,一种新的Agent训练范式,可以有效地利用图形用户界面(GUI)操作和工具调用。实验表明,仅仅为Agent配备工具并不能自动提高性能,因为模型经常在GUI和工具动作之间难以选择,导致准确率下降。ToolCUA通过首先合成交错的GUI-Tool轨迹,然后采用新颖的工具高效路径奖励进行在线Agent强化学习,来指导Agent选择最优动作路径。 AI
影响 这种新的训练范式可以使Agent更强大,能够有效地利用图形界面和外部工具,提高任务完成率并减少错误。
排序理由 该集群描述了一种新的AI Agent训练范式和方法论,以研究论文的形式呈现,并开源了代码和模型权重。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →