PulseAugur
实时 06:37:37
实体 BEHAVIOR-1K

BEHAVIOR-1K

PulseAugur coverage of BEHAVIOR-1K — every cluster mentioning BEHAVIOR-1K across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_43727 ·

    李飞飞团队发布ESI-Bench,用于评估具身空间智能

    李飞飞团队发布了一个名为ESI-Bench的新基准,用于评估AI的具身空间智能。与以往假设最优观察的基准不同,ESI-Bench要求AI代理主动采取行动来收集信息,从而闭合了感知-行动循环。使用GPT-5和Gemini等领先模型进行的初步测试表明,当前的AI在主动探索和决策方面存在困难,表现出“行动盲区”和元认知缺陷,这表明主要挑战在于战略行动而非纯粹的感知。