PulseAugur
实时 11:48:12
English(EN) GroundedPlanBench: Spatially grounded long-horizon task planning for robot manipulation

微软研究院为机器人开发空间锚定任务规划与执行基准

微软研究院推出了 GroundedPlanBench,这是一个旨在评估视觉语言模型(VLM)执行机器人操作长时任务规划能力的新基准。当前基于VLM的机器人规划器常常因自然语言指令的歧义以及动作和位置规划的分离而难以处理复杂任务。新的基准以及一个名为 Video-to-Spatially Grounded Planning (V2GP) 的框架,旨在通过使VLM能够共同确定要采取的动作及其发生地点来改进机器人规划,并在评估中优于分离式方法。 AI

排序理由 该集群描述了一篇研究论文中发布的机器人规划新基准和框架。

在 Microsoft Research 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

微软研究院为机器人开发空间锚定任务规划与执行基准

报道来源 [1]

  1. Microsoft Research TIER_1 English(EN) · Sehun Jung, HyunJee Song, Dong-Hee Kim, Reuben Tan, Jianfeng Gao, Yong Jae Lee, Donghyun Kim ·

    GroundedPlanBench:机器人操作的空间地面长视域任务规划

    <p>Vision-language models (VLMs) use images and text to plan robot actions, but they still struggle to decide what actions to take and where to take them. Most systems split these decisions into two steps: a VLM generates a plan in natural language, and a separate model translate…