English(EN) Viewpoint-Agnostic Grasp Pipeline using VLM and Partial Observations

视觉语言模型管道为具有部分观测的机器人实现视角无关抓取

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-06 04:00

研究人员开发了一种新的端到端语言引导抓取管道，提高了移动机械手在混乱环境中的鲁棒性。该系统使用视觉语言模型（VLMs）和部分观测来理解自然语言指令，通过深度补偿和点云补全提高几何可靠性，并生成安全、可执行的抓取。在四足机器人上的评估显示成功率为 90%，显著优于依赖视角的基线。 AI

影响提高了机器人在复杂、遮挡环境中的操作能力，可能实现更通用的自主系统。

排序理由这是一篇详细介绍机器人抓取新管道的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Dilermando Almeida, Juliano Negri, Guilherme Lazzarini, Thiago H. Segreto, Ranulfo Bezerra, Ricardo V. Godoy, Marcelo Becker · 2026-05-06 04:00

使用视觉语言模型和部分观测的视图无关抓取管道

arXiv:2603.07866v2 Announce Type: replace-cross Abstract: Robust grasping in cluttered, unstructured environments remains challenging for mobile legged manipulators due to occlusions that lead to partial observations, unreliable depth estimates, and the need for collision-free, e…