研究人员推出CogCanvas,一个旨在评估图像生成模型在复杂多主体场景下能力的新基准。该基准通过评估多个身份、对象绑定和背景一致性的联合保留,解决了现有工具的局限性。CogCanvas包含1,952张精选图像和1,361个构图提示,支持基于参考的多人对象生成和文本到图像生成等任务。对最先进模型的初步基准测试显示,随着主体数量的增加,性能显著下降,尤其是在绑定对象和时尚单品方面。 AI
影响 该基准突显了AI图像生成在复杂场景中当前的局限性,可能指导未来研究朝着更强大的多主体和构图能力发展。
排序理由 该集群描述了一个新的基准和相关指标,用于评估AI图像生成模型,已在arXiv上发布。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →