English(EN) CV-Arena: An Open Benchmark for Instructional Computer Vision Problem Solving with Human-AI Collaborative Preferences

新的CV-Arena基准评估指令引导的图像编辑

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 04:00

研究人员推出了CV-Arena，一个旨在评估指令引导的图像编辑能力的新基准。该基准包含16种任务类型下的12,000个真实图像指令对，旨在捕捉专业工作流程，而不仅仅是简单的外观编辑。它还提出了Active Elo，一个用于可扩展评估的人机协作偏好协议，并展示了像CV-Agent这样的代理模型在改进视觉编辑中的指令遵循方面的潜力。 AI

影响为评估复杂的图像编辑任务建立了新标准，可能推动多模态AI能力的进步。

排序理由该集群包含一篇介绍新基准和评估协议的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Fangzhou Lin, Peiran Li, Lingyu Xu, Wenjing Chen, Qianwen Ge, Shuo Xing, Mingyang Wu, Xiangbo Gao, Siyuan Yang, Kazunori Yamada, Ziming Zhang, Haichong Zhang, Zhen Dong, Ming-Hsuan Yang, Zhengzhong Tu · 2026-06-02 04:00

CV-Arena: An Open Benchmark for Instructional Computer Vision Problem Solving with Human-AI Collaborative Preferences

arXiv:2606.00931v1 Announce Type: cross Abstract: Instruction-guided image editing is becoming a general interface for visual work, yet existing benchmarks still focus largely on narrow appearance edits and do not fully capture the diversity of real-image tasks in professional wo…

报道来源 [1]

CV-Arena: An Open Benchmark for Instructional Computer Vision Problem Solving with Human-AI Collaborative Preferences

相关话题