研究人员推出了CoVEBench,这是一个旨在评估文本引导视频编辑模型能力的新基准。该基准解决了现有模型在处理复杂、多步编辑指令时遇到的局限性。CoVEBench包含大量视频和编辑指令,评估模型遵守指令和保持视频保真度的能力,揭示出当前模型常常无法同时执行多个编辑或准确保留内容。 AI
影响 凸显了AI视频编辑的当前局限性,推动了能够处理复杂、多步指令并保留内容的模型的开发。
排序理由 发布用于AI模型评估的新学术基准。
在 Hugging Face Daily Papers 阅读 →
- CoVEBench
- multimodal large language models
- text-guided video editing models
- MLLM
- video editing models
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →