English(EN) DivRL: Disentangled Self-Similarity Rewards for Diverse Subject-Driven Generation

DivRL框架解决了图像生成的身份-多样性悖论

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-24 04:00

研究人员开发了一个新的训练后框架DivRL，以解决主体驱动图像生成中的“身份-多样性悖论”。当保持强大的身份一致性导致输出多样性较低时，就会出现这种悖论。DivRL使用解耦的视觉特征同时优化身份一致性和结构多样性。该框架引入了用于多样性的负自相似度量（nSSM）和用于身份的视觉语义匹配（VSM）。通过将VSM视为门控约束，DivRL惩罚违反身份阈值的样本，从而能够联合改进nSSM和VSM。 AI

影响这项研究提供了一种新颖的方法来提高生成图像的多样性，同时保持身份一致性，可能使创意AI工具受益。

排序理由该集群包含一篇详细介绍图像生成新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Qian Wang, Zhenyu Li, Abdelrahman Eldesokey, Peter Wonka · 2026-06-24 04:00

DivRL：用于多样化主体驱动生成的解耦自相似奖励

arXiv:2606.23950v1 Announce Type: new Abstract: Subject-driven image generation faces an "Identity-Diversity Paradox", where strong identity preservation often leads to rigid and low-diversity outputs. We propose a post-training framework called DivRL that jointly optimizes ident…

报道来源 [1]

DivRL：用于多样化主体驱动生成的解耦自相似奖励

相关实体

相关话题