PulseAugur
实时 14:46:13
实体 EditReward-Compass

EditReward-Compass

PulseAugur coverage of EditReward-Compass — every cluster mentioning EditReward-Compass across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_30574 ·

    新的基准套件旨在改进图像编辑模型评估

    研究人员推出了 Edit-Compass 和 EditReward-Compass,这是一个统一的基准,旨在更准确地评估图像编辑模型及其相关的奖励模型。新套件解决了现有基准的局限性,这些基准由于任务难度不足和评估方法粗糙,往往无法反映人类判断。Edit-Compass 包含六个难度级别的 2,388 个标注实例,使用细粒度的多维框架评估推理和多图像编辑等能力。EditReward-Compass 包含 2,251 对偏好数据,以模拟强…