PulseAugur
实时 12:33:54
English(EN) Inference-time Policy Steering via Vision and Touch

新的ViTaL框架通过视觉和触觉增强机器人策略引导

研究人员开发了ViTaL,一个用于在部署期间引导预训练生成式机器人策略的新框架。该系统使用视觉和触觉信息来优化执行前的候选动作,解决了仅用视觉方法在富含接触的操作任务中的局限性。ViTaL将多模态引导构建为一个双层优化问题,其中视觉采样用于长时域模式选择,触觉引导的扩散编辑用于短时域精炼。该框架包含一个视觉-触觉潜在世界模型和学习到的验证器,包括一个文本条件触觉奖励,以提高在实际操作任务中的成功率。 AI

影响 通过整合多模态感官反馈以改进动作选择和精炼,增强了机器人操作能力。

排序理由 该集群包含一篇详细介绍机器人新框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Yilin Wu, Zilin Si, Zeynep Temel, Oliver Kroemer, Andrea Bajcsy ·

    Inference-time Policy Steering via Vision and Touch

    arXiv:2606.14981v1 Announce Type: cross Abstract: Inference-time steering adapts pre-trained generative robot policies during deployment by verifying candidate actions before execution. While prior methods typically perform this verification only with visual observations, vision …