English(EN) IMAGIN-4D: Image-Guided Controllable Interaction Generation

IMAGIN-4D 使用图像条件生成人与物交互

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-22 17:58

研究人员开发了 IMAGIN-4D，一种新颖的基于扩散的系统，用于生成利用参考图像进行更精确控制的人与物交互（HOI）。与依赖文本、物体几何或航点（waypoints）的先前方法不同，IMAGIN-4D 在空间和时间上分解了图像条件。这使得系统能够从参考图像中提取特定帧的特定交互状态，并关注生成序列中的不同视觉线索。与现有基线相比，该系统在细粒度交互控制和航点遵循方面表现出改进。 AI

影响这项研究可能带来更逼真、更可控的角色动画以及改进的机器人操作能力。

排序理由这是一篇详细介绍生成人与物交互新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Shreyas Hampali · 2026-06-22 17:58

IMAGIN-4D: Image-Guided Controllable Interaction Generation

Generating human-object interactions (HOI) is central to character animation, robotics, AR/VR, and embodied AI. Recent HOI generation methods synthesize motion from text, object geometry, and sparse waypoints, controlling action semantics and object trajectories. However, these s…

报道来源 [1]

IMAGIN-4D: Image-Guided Controllable Interaction Generation

相关实体

相关话题