研究人员开发了ShotCrop$^3$,一个用于从单个人类中心图像自动生成电影三镜头构图的新颖系统。该系统旨在提供多个裁剪——远景、中景和特写——每个裁剪都附有描述性字幕,以辅助视觉叙事。ShotCrop$^3$采用三阶段训练过程,包括思维链微调、带伪标签的半监督学习以及组相对策略优化(GRPO-S),以增强其美学和叙事裁剪能力。 AI
影响 这项研究通过自动化生成用于视觉叙事的各种镜头,可以实现更高效的内容创作工作流程。
排序理由 这是一篇描述新方法和图像构图基准的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →