English(EN) OmniDance: Multimodal Driven Dance Video Generation with Large-scale Internet Data

OmniDance框架利用文本和音乐生成舞蹈视频

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

研究人员推出OmniDance，一个由文本和音乐驱动的新型舞蹈视频生成框架。该框架旨在将音乐作为时间条件信号集成到现有的视频生成基础模型中，同时不损害其原有的可控性或视觉质量。为此，他们还开发了CIPE-Dance，一个包含超过30万个来自互联网的舞蹈视频片段的大规模数据集，并附有基于编舞的文本注释。 AI

影响这项研究推动了多模态AI的能力，有望为创意应用带来更复杂、更具表现力的AI生成视频内容。

排序理由该集群包含一篇详细介绍用于AI驱动视频生成的新框架和数据集的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Kaixing Yang, Jiashu Zhu, Xulong Tang, Ziqiao Peng, Xiangyue Zhang, Chubin Chen, Puwei Wang, Jiahong Wu, Xiangxiang Chu, Hongyan Liu, Jun He · 2026-06-30 04:00

OmniDance: Multimodal Driven Dance Video Generation with Large-scale Internet Data

arXiv:2606.30019v1 Announce Type: new Abstract: Music-driven dance video generation aims to synthesize expressive human motion that is temporally aligned with music while maintaining high visual fidelity. Despite recent progress, existing methods still face two key limitations: t…

报道来源 [1]

OmniDance: Multimodal Driven Dance Video Generation with Large-scale Internet Data

相关话题