PulseAugur
实时 11:02:58
实体 Robustness-driven Trajectory Synthesis

Robustness-driven Trajectory Synthesis

PulseAugur coverage of Robustness-driven Trajectory Synthesis — every cluster mentioning Robustness-driven Trajectory Synthesis across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_58867 ·

    新的基准和数据合成提升GUI代理的错误恢复能力

    研究人员开发了一个新的基准和数据合成框架,以提高GUI代理的错误恢复能力。该基准GUI-RobustEval包含1200多个测试用例,用于系统地衡量代理从自身错误中恢复的程度。此外,一个名为RoTS的框架生成了80万个数据点,用于训练代理处理各种错误模式及其相应的恢复步骤。使用这些数据微调的模型,如RoTS-32B,已显示出显著的性能提升,并在OSWorld等基准测试中取得了最先进的成果。