研究人员推出了VTEdit-Bench,一个旨在评估虚拟试穿(VTON)应用中通用多参考图像编辑模型的新基准。该基准包含24,220个测试图像对,涵盖五个复杂度递增的VTON任务。它还包含VTEdit-QA,一个基于VLM的评估器,用于评估模型的连贯性、衣物一致性和图像质量。初步评估显示,领先的通用编辑器在简单任务上具有竞争力,并且能更好地泛化到更难的场景,尽管它们在复杂的参考配置,特别是涉及多件衣物的配置上仍存在困难。 AI
影响 该基准将能够更系统地评估虚拟试穿应用的通用图像编辑模型,有望加速开发更灵活、更鲁棒的VTON系统。
排序理由 该集群描述了一篇介绍AI模型基准和评估框架的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →