研究人员开发了一个新的训练后框架DivRL,以解决主体驱动图像生成中的“身份-多样性悖论”。当保持强大的身份一致性导致输出多样性较低时,就会出现这种悖论。DivRL使用解耦的视觉特征同时优化身份一致性和结构多样性。该框架引入了用于多样性的负自相似度量(nSSM)和用于身份的视觉语义匹配(VSM)。通过将VSM视为门控约束,DivRL惩罚违反身份阈值的样本,从而能够联合改进nSSM和VSM。 AI
影响 这项研究提供了一种新颖的方法来提高生成图像的多样性,同时保持身份一致性,可能使创意AI工具受益。
排序理由 该集群包含一篇详细介绍图像生成新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →