PulseAugur
实时 07:24:51

Next Forcing 通过多块预测加速视频生成

研究人员推出了一种用于自回归视频生成中因果世界建模的新颖框架“Next Forcing”。这种多块预测(MCP)方法通过同时预测多个未来的视频块来提高训练速度和准确性。该方法在 RoboTwinPhyWorld 等基准测试中取得了最先进的结果,并将推理速度提高了 2 倍。 AI

影响 加速视频生成训练和推理,可能支持更复杂的实时模拟和应用。

排序理由 这是一篇详细介绍视频生成新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Yinghao Xu ·

    Next Forcing: Causal World Modeling with Multi-Chunk Prediction

    Autoregressive video generation has emerged as a powerful paradigm for World Action Models (WAMs). However, existing approaches suffer from slow training convergence and limited converged accuracy, particularly at high frame rates, as the training supervision is confined to the c…