English(EN) SPEAR-1: Scaling Beyond Robot Demonstrations via 3D Understanding

SPEAR-1: 通过3D理解实现超越机器人演示的扩展

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-28 04:00

研究人员开发了SPEAR-1，这是一种机器人基础模型，旨在通过整合3D空间推理来提高机器人控制的泛化能力。与先前主要在2D图像-语言任务上训练的模型不同，SPEAR-1通过使用带有3D注释增强的非机器人数据获得的3D理解来增强视觉-语言模型。这种方法使SPEAR-1能够使用显著更少的机器人演示来实现最先进的性能，其表现优于$\pi_0$-FAST和$\pi_{0.5}$等模型，同时所需的机器人数据样本减少了20倍。 AI

影响通过整合3D理解来增强机器人控制的泛化能力，有可能减少对大量机器人数据的需求。

排序理由这是一篇详细介绍机器人基础模型新模型和方法的学术论文。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Nikolay Nikolov, Giuliano Albanese, Sombit Dey, Aleksandar Yanev, Luc Van Gool, Jan-Nico Zaech, Danda Pani Paudel · 2026-04-28 04:00

SPEAR-1：通过3D理解实现超越机器人演示的扩展

arXiv:2511.17411v2 Announce Type: replace-cross Abstract: Robotic Foundation Models (RFMs) hold great promise as generalist, end-to-end systems for robot control. Yet their ability to generalize across new environments, tasks, and embodiments remains limited. We argue that a majo…

报道来源 [1]

SPEAR-1：通过3D理解实现超越机器人演示的扩展

相关实体

相关话题