English(EN) Controllable Egocentric Video Generation via Occlusion-Aware Sparse 3D Hand Joints

新方法通过3D手部关节控制增强自我中心视频生成

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-26 04:00

研究人员开发了一种新的可控自我中心视频生成方法，专注于复杂的手-物体交互。该方法利用稀疏的3D手部关节作为显式控制信号，以克服现有方法在3D一致性和运动伪影方面的局限性，尤其是在遮挡期间。这项新技术结合了遮挡感知特征和3D几何嵌入，以确保结构一致性并改善运动传播。研究团队还创建了一个自动流水线，用于生成大量高质量的自我中心视频片段用于训练和评估，并在当前最先进的基线之上展示了卓越的性能。 AI

影响这项研究可能推动视觉世界模型的发展，并提高生成内容中人机交互的真实感。

排序理由该集群包含一篇详细介绍新颖视频生成方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

Chenyangguang Zhang

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Chenyangguang Zhang, Botao Ye, Boqi Chen, Alexandros Delitzas, Fangjinhua Wang, Marc Pollefeys, Xi Wang · 2026-06-26 04:00

Controllable Egocentric Video Generation via Occlusion-Aware Sparse 3D Hand Joints

arXiv:2603.11755v2 Announce Type: replace Abstract: Controllable video generation for complex hand-object interactions is a critical step toward building visual world models. However, existing methods often struggle to achieve fine-grained, 3D-consistent hand articulation in gene…

报道来源 [1]

Controllable Egocentric Video Generation via Occlusion-Aware Sparse 3D Hand Joints

相关话题