TIDE 框架统一视频编辑与生成任务

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 04:00

研究人员开发了 TIDE，一个旨在将视频编辑和生成任务统一在单一模型中的新颖框架。TIDE 利用每 token 的任务嵌入来区分各种条件输入，例如目标、源和参考 token。该框架还采用双路径条件方案和渐进式多任务训练策略，以增强其处理多样化视频操作目标的能力，并在多个基准测试中取得最先进的成果。 AI

影响引入了一个统一的视频编辑和生成框架，有望简化工作流程并提高跨多样化任务的性能。

排序理由这是一篇描述用于视频编辑和生成的新模型架构和训练策略的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Qi Liu, Gang Yue, Mingyu Yin, Lisai Zhang, Yidi Wu, Yaole Wang, Yaohui Wang, Chang Yao, Jingyuan Chen, Lin Ma · 2026-06-09 04:00

TIDE：用于统一视频编辑和生成的任务隔离扩散模型

arXiv:2606.08260v1 Announce Type: new Abstract: Recent advances in Diffusion Transformers have driven rapid progress in video generation and editing, yet these capabilities are still handled by separate, task-specific models. Building a unified framework that supports diverse vid…

报道来源 [1]

TIDE：用于统一视频编辑和生成的任务隔离扩散模型

相关实体

相关话题