PulseAugur
实时 02:05:02
实体 Offline Preference-Based Trajectory Evaluation

Offline Preference-Based Trajectory Evaluation

PulseAugur coverage of Offline Preference-Based Trajectory Evaluation — every cluster mentioning Offline Preference-Based Trajectory Evaluation across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_95915 ·

    新的基于偏好的方法改进了AI代理评估

    研究人员推出了一种名为偏好轨迹评估的新方法来评估代理系统。该方法根据对进度和返回时间的时间偏好来比较轨迹,旨在克服传统基于成功率的指标的局限性,这些指标通常会导致大量平局。新方法显著减少了平局,提高了跨各种基准的评估的区分度和稳定性。