研究人员推出了 IntentionNav,这是一个新的基准,旨在测试具身 AI 代理根据隐式人类指令进行导航和查找对象的能力。与指定目标对象的先前基准不同,IntentionNav 要求代理从自由文本意图中推断出对象,例如需要某物来加热食物。该基准包含 176 个模拟场景中的 500 个意图,评估表明当前模型在目标推断和任务成功完成方面存在困难,突显了间接人类意图是一个重大的瓶颈。 AI
影响 该基准可以通过专注于导航任务中更自然、基于意图的人机交互来推动具身 AI 的进步。
排序理由 发布了新的 AI 研究基准。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →