English(EN) MICo-150K: A Comprehensive Dataset Advancing Multi-Image Composition

新的MICo-150K数据集和基准测试推动多图像组合任务发展

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-29 04:00

研究人员推出了MICo-150K，这是一个旨在提高AI模型多图像组合（MICo）能力的大规模数据集。该数据集通过将MICo分为七个任务并提供高质量的合成图像，解决了从多个参考图像合成连贯图像的挑战。MICo-150K包含一个用于真实世界图像分解和重组的独特子集，以及一个基准套件和一个名为Weighted-Ref-VIEScore的新评估指标。在该数据集上微调模型已显示出在MICo任务中的显著改进，基线模型Qwen-MICo表现出增强的性能。 AI

影响增强了AI从多个参考图像生成复杂图像的能力，可能改进创意工具和视觉内容生成。

排序理由该集群描述了一篇介绍多图像组合数据集和基准测试的新学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Xinyu Wei, Kangrui Cen, Hongyang Wei, Zhen Guo, Kai Cui, Bairui Li, Zeqing Wang, Jinrui Zhang, Lei Zhang · 2026-04-29 04:00

MICo-150K：一个推动多图像合成的综合数据集

arXiv:2512.07348v2 Announce Type: replace Abstract: In controllable image generation, synthesizing coherent and consistent images from multiple reference inputs, i.e., Multi-Image Composition (MICo), remains a challenging problem, partly hindered by the lack of high-quality train…

报道来源 [1]

MICo-150K：一个推动多图像合成的综合数据集

相关实体

相关话题