实体
Shaoje Zhang
Shaoje Zhang
PulseAugur coverage of Shaoje Zhang — every cluster mentioning Shaoje Zhang across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新的 GAIA 系统训练批评模型以提高 GUI 代理性能
研究人员开发了 GAIA,一个数据飞轮系统,旨在通过训练直观批评模型 (ICM) 来提高 GUI 代理的性能。该 ICM 评估代理操作的正确性,选择成功概率更高的操作。然后,系统使用此批评模型收集精炼数据,进而训练出更强大的批评模型,形成一个自我改进的循环。实验表明,这种迭代过程提高了各种 GUI 代理的测试时性能。
-
新框架通过自批判RL增强GUI代理的可信赖性
研究人员开发了一个名为HyperClick的新框架,以提高图形用户界面(GUI)代理的可信赖性。该框架使用自批判强化学习(SCRL)来确保代理提供的置信度信号更准确地反映其基础正确性。通过优化准确性和置信度可靠性,HyperClick旨在使GUI自动化系统在不确定时能够避免执行操作,从而提高整体可靠性。