研究人员推出了一种用于自回归视频生成中因果世界建模的新颖框架“Next Forcing”。这种多块预测(MCP)方法通过同时预测多个未来的视频块来提高训练速度和准确性。该方法在 RoboTwin 和 PhyWorld 等基准测试中取得了最先进的结果,并将推理速度提高了 2 倍。 AI
影响 加速视频生成训练和推理,可能支持更复杂的实时模拟和应用。
排序理由 这是一篇详细介绍视频生成新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →