研究人员开发了生成可控视频世界模型的新方法。DisCo 专注于使用离散动作原语来改进相机运动的控制,解决了连续轨迹的问题。Prisma-World 通过联合几何感知去噪过程确保跨视图一致性,解决了多智能体视频生成的挑战,并引入了一个用于训练和评估的新数据集。 AI
影响 可控视频生成方面的这些进步可以为训练和模拟提供更现实和更具交互性的虚拟环境。
排序理由 该集群包含两篇介绍视频生成新模型和数据集的研究论文。
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 4 个来源。 我们如何撰写摘要 →