研究人员推出了 VEBENCH,这是一个旨在评估大型多模态模型 (LMM) 在真实世界视频编辑任务中的新基准。该基准包含超过 3.9K 个编辑过的视频和 3,080 对问答,重点关注识别编辑技术和模拟编辑工作流程。使用 VEBENCH 进行的实验揭示了当前 LMM 在视频编辑方面的能力与人类能力之间存在显著的性能差距,突显了改进多模态推理和操作能力的需求。 AI
影响 为评估视频编辑中的人工智能树立了新标准,可能指导未来更强大的创意人工智能工具的开发。
排序理由 这是一篇介绍用于评估人工智能模型的新基准的研究论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →