研究人员开发了 IMAGIN-4D,一种新颖的基于扩散的系统,用于生成利用参考图像进行更精确控制的人与物交互(HOI)。与依赖文本、物体几何或航点(waypoints)的先前方法不同,IMAGIN-4D 在空间和时间上分解了图像条件。这使得系统能够从参考图像中提取特定帧的特定交互状态,并关注生成序列中的不同视觉线索。与现有基线相比,该系统在细粒度交互控制和航点遵循方面表现出改进。 AI
影响 这项研究可能带来更逼真、更可控的角色动画以及改进的机器人操作能力。
排序理由 这是一篇详细介绍生成人与物交互新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →