PulseAugur
实时 03:00:13
实体 IntentScore

IntentScore

PulseAugur coverage of IntentScore — every cluster mentioning IntentScore across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
时间线
  1. 2026-05-25 research_milestone A new paper introduces IntentScore, a plan-aware reward model for evaluating actions of computer-use agents. 来源
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_48787 ·

    IntentScore 通过评估动作质量提高 AI 代理的可靠性

    研究人员开发了一种名为 IntentScore 的新奖励模型,以提高自动化桌面任务的计算机使用代理(CUA)的可靠性。CUA 经常犯不可逆的错误,因为它们缺乏评估动作质量的机制。IntentScore 通过学习根据候选动作的相关性和正确性对其进行评分来解决这个问题,在成对判别中达到了 97.5% 的准确率。当部署在 OSWorld 环境中时,IntentScore 将任务成功率提高了 6.9 个百分点,证明了其在未见场景中的有效性。