研究人员推出 ACE-Ego-0,一个新颖的预训练框架,旨在统一用于视觉-语言-动作 (VLA) 模型的各种数据源。该框架通过将人类视频转换为机器人格式的伪动作轨迹,解决了整合人类以自我为中心的视频与机器人轨迹数据这一挑战。ACE-Ego-0 采用可靠性感知训练目标,以有效利用嘈杂的人类生成动作数据,从而提高具身人工智能任务的性能。 AI
排序理由 该集群描述了一篇关于用于VLA模型预训练的新型AI框架的最新研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →