实体 EgoPoint-Bench

EgoPoint-Bench

PulseAugur coverage of EgoPoint-Bench — every cluster mentioning EgoPoint-Bench across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

最近 · 第 1/1 页 · 共 1 条

RESEARCH · CL_02922 · Apr 23 · 09:15

多模态大语言模型（MLLMs）难以理解自我中心的指向性，新的基准测试EgoPoint-Bench揭示了这一点

研究人员开发了EgoPoint-Bench，这是一个旨在测试多模态大语言模型（MLLMs）在自我中心视觉中理解指向手势能力的新基准。目前的MLLMs常常无法准确解读指向，而是依赖于不那么精确的线索，如邻近性。该基准测试包含超过11,000个模拟和真实世界样本，旨在提高AI代理的空间推理能力，以用于智能眼镜等任务。