研究人员开发了新的基准来评估视觉AI模型的精确编辑能力。PaintBench专注于20项基本图像编辑操作,发现当前行业领导者的平均得分仅为17.1%。另一方面,NRVBench评估非刚性视频编辑,考察模型在保持特定材料合理性的同时修改可变形运动的能力。两个基准都突显了当前模型在执行复杂、精确视觉操作方面的显著局限性。 AI
影响 这些基准将推动多模态AI系统中精确视觉编辑的进步。
排序理由 该集群包含两篇介绍用于评估AI模型的新基准的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →