研究人员开发了TrajLoc,一种用于图像到视频生成中多对象运动控制的新颖方法。该方法直接解决了在具有交叉或遮挡路径的拥挤场景中保持对象身份和轨迹遵循的挑战。TrajLoc通过将交叉注意力权重替换为以目标位置为中心的斯高斯热图来实现这一点,确保独立执行每个对象的空间约束。TrajLoc应用于不同的模型骨干网,已在各种数据集上展示了视觉保真度和轨迹遵循方面的显著改进。 AI
影响 该方法可以提高具有多个移动对象的AI生成视频的控制力和真实感。
排序理由 该集群包含一篇详细介绍特定AI任务新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →