PulseAugur
实时 10:07:13
English(EN) InterCMDM: Block-Causal Diffusion for Autoregressive Human Interaction Generation

InterCMDM框架实现可控、长时程人类交互生成

研究人员推出了一种新颖的块因果潜在扩散框架InterCMDM,用于自回归人类交互生成。该模型利用双流因果扩散Transformer为每个人维护独立的因果流,并通过统一的双流注意力与多任务注意力掩码来模拟人际依赖关系。通过在推理时选择所需的掩码,这些掩码可以控制各种协调行为,例如同步动作、响应式反应和领导者-追随者动态。该框架的块状扩散目标能够稳定地在长序列上进行潜在的滚动,而无需重复的解码-编码循环,通过改善文本-运动对齐、真实感和长时程连续性,在InterHuman和Inter-X等基准测试中取得了最先进的性能。 AI

影响 这项研究推动了人类交互的可控和长时程生成,可能对动画、机器人和虚拟现实应用产生影响。

排序理由 该集群包含一篇详细介绍人类交互生成新模型和框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

InterCMDM框架实现可控、长时程人类交互生成

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Qing Yu, Kent Fujiwara ·

    InterCMDM: Block-Causal Diffusion for Autoregressive Human Interaction Generation

    arXiv:2607.01743v1 Announce Type: new Abstract: Text-conditioned human interaction generation must capture both long-range temporal causality within each individual and tightly coupled coordination between partners. Existing interaction diffusion models typically denoise full seq…