PulseAugur
实时 13:58:27
实体 MapSatisfyBench

MapSatisfyBench

PulseAugur coverage of MapSatisfyBench — every cluster mentioning MapSatisfyBench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_96097 ·

    新基准评估AI地图代理的满意度感知决策能力

    研究人员推出了MapSatisfyBench,这是一个新的基准测试,旨在评估地图代理在显式任务完成之外理解和满足用户隐式需求的能力。该基准测试从行为数据中重建完整的用户需求,识别隐式决策因素,并仅保留那些有预查询证据支持的因素。实验表明,当前代理在显式任务完成方面表现出色,但在隐式因素和主动收集支持性证据方面存在困难,这突显了将评估重点转移到满意度感知的空间决策制定上的必要性。