PulseAugur
实时 21:58:35
English(EN) SPEAR-1: Scaling Beyond Robot Demonstrations via 3D Understanding

SPEAR-1: 通过3D理解实现超越机器人演示的扩展

研究人员开发了SPEAR-1,这是一种机器人基础模型,旨在通过整合3D空间推理来提高机器人控制的泛化能力。与先前主要在2D图像-语言任务上训练的模型不同,SPEAR-1通过使用带有3D注释增强的非机器人数据获得的3D理解来增强视觉-语言模型。这种方法使SPEAR-1能够使用显著更少的机器人演示来实现最先进的性能,其表现优于$\pi_0$-FAST和$\pi_{0.5}$等模型,同时所需的机器人数据样本减少了20倍。 AI

影响 通过整合3D理解来增强机器人控制的泛化能力,有可能减少对大量机器人数据的需求。

排序理由 这是一篇详细介绍机器人基础模型新模型和方法的学术论文。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

SPEAR-1: 通过3D理解实现超越机器人演示的扩展

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Nikolay Nikolov, Giuliano Albanese, Sombit Dey, Aleksandar Yanev, Luc Van Gool, Jan-Nico Zaech, Danda Pani Paudel ·

    SPEAR-1: Scaling Beyond Robot Demonstrations via 3D Understanding

    arXiv:2511.17411v2 Announce Type: replace-cross Abstract: Robotic Foundation Models (RFMs) hold great promise as generalist, end-to-end systems for robot control. Yet their ability to generalize across new environments, tasks, and embodiments remains limited. We argue that a majo…