研究人员推出了一种新颖的块因果潜在扩散框架InterCMDM,用于自回归人类交互生成。该模型利用双流因果扩散Transformer为每个人维护独立的因果流,并通过统一的双流注意力与多任务注意力掩码来模拟人际依赖关系。通过在推理时选择所需的掩码,这些掩码可以控制各种协调行为,例如同步动作、响应式反应和领导者-追随者动态。该框架的块状扩散目标能够稳定地在长序列上进行潜在的滚动,而无需重复的解码-编码循环,通过改善文本-运动对齐、真实感和长时程连续性,在InterHuman和Inter-X等基准测试中取得了最先进的性能。 AI
影响 这项研究推动了人类交互的可控和长时程生成,可能对动画、机器人和虚拟现实应用产生影响。
排序理由 该集群包含一篇详细介绍人类交互生成新模型和框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →