PulseAugur
实时 15:17:20
实体 EgoPoint-Bench

EgoPoint-Bench

PulseAugur coverage of EgoPoint-Bench — every cluster mentioning EgoPoint-Bench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_02922 ·

    多模态大语言模型(MLLMs)难以理解自我中心的指向性,新的基准测试EgoPoint-Bench揭示了这一点

    研究人员开发了EgoPoint-Bench,这是一个旨在测试多模态大语言模型(MLLMs)在自我中心视觉中理解指向手势能力的新基准。目前的MLLMs常常无法准确解读指向,而是依赖于不那么精确的线索,如邻近性。该基准测试包含超过11,000个模拟和真实世界样本,旨在提高AI代理的空间推理能力,以用于智能眼镜等任务。