研究人员推出了 JAVEdit-100k,这是一个专为指令引导的联合音频-视觉视频编辑设计的新型大规模数据集。该数据集包含约 100,000 个跨五个类别的编辑三元组,使用具有代理式循环质量控制的新颖生成流程创建。为了标准化评估,他们还开发了 JAVEditBench,一个全面的基准测试,并提出了 JAVEdit,一个在多个指标上表现优越的基线模型。 AI
影响 通过提供专门的音频-视觉同步资源,实现了更复杂的 AI 驱动视频编辑。
排序理由 该集群包含一篇介绍数据集、基准测试和基线模型的新学术论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →