PulseAugur
实时 15:29:26
English(EN) IMAGIN-4D: Image-Guided Controllable Interaction Generation

IMAGIN-4D 使用图像条件生成人与物交互

研究人员开发了 IMAGIN-4D,一种新颖的基于扩散的系统,用于生成利用参考图像进行更精确控制的人与物交互(HOI)。与依赖文本、物体几何或航点(waypoints)的先前方法不同,IMAGIN-4D 在空间和时间上分解了图像条件。这使得系统能够从参考图像中提取特定帧的特定交互状态,并关注生成序列中的不同视觉线索。与现有基线相比,该系统在细粒度交互控制和航点遵循方面表现出改进。 AI

影响 这项研究可能带来更逼真、更可控的角色动画以及改进的机器人操作能力。

排序理由 这是一篇详细介绍生成人与物交互新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

IMAGIN-4D 使用图像条件生成人与物交互

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Shreyas Hampali ·

    IMAGIN-4D: Image-Guided Controllable Interaction Generation

    Generating human-object interactions (HOI) is central to character animation, robotics, AR/VR, and embodied AI. Recent HOI generation methods synthesize motion from text, object geometry, and sparse waypoints, controlling action semantics and object trajectories. However, these s…