English(EN) Auteur: Language-Driven Cinematographic Framing for Human-Centric Video Generation

Auteur 支持语言驱动的电影摄像控制，用于视频生成

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 04:00

研究人员开发了 Auteur，这是一种用于生成以人为中心的、通过语言驱动的电影构图的创新方法。与将摄像机运动视为副产品的先前方法不同，Auteur 将摄像机控制相对于演员的姿势和运动进行参数化。经过微调的多模态大型语言模型将自然语言描述和人类运动转换为关键帧，然后将这些关键帧内插为视频生成器的连续摄像机轨迹。该系统能够在生成视频中实现更具意图和更专业的摄像工作，在新颖的、专注于构图的指标上优于现有方法。 AI

影响在生成视频中实现更复杂、由导演控制的摄像工作。

排序理由该集群包含一篇详细介绍视频生成新方法的 ist 研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Muhammed Burak Kizil, Enes Sanli, Niloy J. Mitra, Xuelin Chen, Erkut Erdem, Aykut Erdem, Duygu Ceylan · 2026-06-02 04:00

Auteur: Language-Driven Cinematographic Framing for Human-Centric Video Generation

arXiv:2606.01900v1 Announce Type: new Abstract: Generative video models have achieved remarkable visual fidelity and temporal coherence, yet intentional camera control remains elusive. Existing frameworks treat camera motion as a byproduct of pixel synthesis, producing trajectori…

报道来源 [1]

Auteur: Language-Driven Cinematographic Framing for Human-Centric Video Generation

相关实体

相关话题