研究人员推出OmniDance,一个由文本和音乐驱动的新型舞蹈视频生成框架。该框架旨在将音乐作为时间条件信号集成到现有的视频生成基础模型中,同时不损害其原有的可控性或视觉质量。为此,他们还开发了CIPE-Dance,一个包含超过30万个来自互联网的舞蹈视频片段的大规模数据集,并附有基于编舞的文本注释。 AI
影响 这项研究推动了多模态AI的能力,有望为创意应用带来更复杂、更具表现力的AI生成视频内容。
排序理由 该集群包含一篇详细介绍用于AI驱动视频生成的新框架和数据集的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →