研究人员推出了一种新颖的统一视频-动作去噪模型Donk,专为灵巧机器人手设计。该模型通过对交互视频和手部轨迹的联合分布进行建模来运行,使其能够从各种条件下生成未来的视频和动作策略。值得注意的是,Donk还可以作为数据引擎,仅凭文本提示生成配对的视频-动作回放,从而增强其在动作生成和数据合成中的效用。 AI
影响 引入了一种生成灵巧机器人动作和合成视频数据的统一方法,有望加速机器人学的研究和开发。
排序理由 这是一篇描述新模型及其能力的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →