PulseAugur
实时 09:19:21
实体 ESI-BENCH

ESI-BENCH

PulseAugur coverage of ESI-BENCH — every cluster mentioning ESI-BENCH across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
时间线
  1. 2026-05-22 research_milestone Fei-Fei Li's team released ESI-Bench, a new benchmark for embodied spatial intelligence. 来源
  2. 2026-05-18 research_milestone Introduction of the ESI-Bench benchmark for embodied spatial intelligence. 来源
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_43727 ·

    李飞飞团队发布ESI-Bench,用于评估具身空间智能

    李飞飞团队发布了一个名为ESI-Bench的新基准,用于评估AI的具身空间智能。与以往假设最优观察的基准不同,ESI-Bench要求AI代理主动采取行动来收集信息,从而闭合了感知-行动循环。使用GPT-5和Gemini等领先模型进行的初步测试表明,当前的AI在主动探索和决策方面存在困难,表现出“行动盲区”和元认知缺陷,这表明主要挑战在于战略行动而非纯粹的感知。

  2. RESEARCH · CL_38223 ·

    New ESI-Bench benchmark tests AI agents' active spatial reasoning

    Researchers have introduced ESI-Bench, a new benchmark designed to evaluate embodied spatial intelligence in AI agents. This benchmark focuses on the perception-action loop, where agents actively explore their environme…