PulseAugur
实时 17:02:36
English(EN) ACE-Ego-0: Unifying Egocentric Human and Robotic Data for VLA Pretraining

ACE-Ego-0 框架统一人类和机器人数据以用于VLA模型

研究人员推出 ACE-Ego-0,一个新颖的预训练框架,旨在统一用于视觉-语言-动作 (VLA) 模型的各种数据源。该框架通过将人类视频转换为机器人格式的伪动作轨迹,解决了整合人类以自我为中心的视频与机器人轨迹数据这一挑战。ACE-Ego-0 采用可靠性感知训练目标,以有效利用嘈杂的人类生成动作数据,从而提高具身人工智能任务的性能。 AI

排序理由 该集群描述了一篇关于用于VLA模型预训练的新型AI框架的最新研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. Hugging Face Daily Papers TIER_1 English(EN) ·

    ACE-Ego-0: Unifying Egocentric Human and Robotic Data for VLA Pretraining

    A unified Vision-Language-Action pretraining framework leverages heterogeneous data sources including human egocentric videos and robot trajectories through a reliability-aware training approach that improves performance on embodied AI tasks.