研究人员开发了ViTaL,一个用于在部署期间引导预训练生成式机器人策略的新框架。该系统使用视觉和触觉信息来优化执行前的候选动作,解决了仅用视觉方法在富含接触的操作任务中的局限性。ViTaL将多模态引导构建为一个双层优化问题,其中视觉采样用于长时域模式选择,触觉引导的扩散编辑用于短时域精炼。该框架包含一个视觉-触觉潜在世界模型和学习到的验证器,包括一个文本条件触觉奖励,以提高在实际操作任务中的成功率。 AI
影响 通过整合多模态感官反馈以改进动作选择和精炼,增强了机器人操作能力。
排序理由 该集群包含一篇详细介绍机器人新框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →