English(EN) Refinement via Regeneration: Enlarging Modification Space Boosts Image Refinement in Unified Multimodal Models

新的通过再生进行精炼（RvR）方法增强了图像生成模型

作者 PulseAugur 编辑部 · [2 个来源] · 2026-04-28 13:36

研究人员推出了一种名为“通过再生进行精炼”（Refinement via Regeneration, RvR）的新框架，用于改进文本到图像生成模型。与依赖编辑指令的先前方法不同，RvR将精炼视为一个再生过程。这种方法通过根据目标提示和初始图像的语义令牌再生图像，从而允许更大的修改空间，实现更完整的语义对齐。 AI

影响引入了一种新颖的基于再生的图像精炼方法，有望提高文本到图像模型中的语义对齐和输出质量。

排序理由这是一篇详细介绍多模态模型中图像精炼新框架的研究论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.CV TIER_1 English(EN) · Jiayi Guo, Linqing Wang, Jiangshan Wang, Yang Yue, Zeyu Liu, Zhiyuan Zhao, Qinglin Lu, Gao Huang, Chunyu Wang · 2026-04-29 04:00

通过再生进行精炼：扩大修改空间可增强统一多模态模型中的图像精炼能力

arXiv:2604.25636v1 Announce Type: new Abstract: Unified multimodal models (UMMs) integrate visual understanding and generation within a single framework. For text-to-image (T2I) tasks, this unified capability allows UMMs to refine outputs after their initial generation, potential…
arXiv cs.CV TIER_1 English(EN) · Chunyu Wang · 2026-04-28 13:36

通过再生进行精炼：扩大修改空间可增强统一多模态模型中的图像精炼能力

Unified multimodal models (UMMs) integrate visual understanding and generation within a single framework. For text-to-image (T2I) tasks, this unified capability allows UMMs to refine outputs after their initial generation, potentially extending the performance upper bound. Curren…

报道来源 [2]

通过再生进行精炼：扩大修改空间可增强统一多模态模型中的图像精炼能力

通过再生进行精炼：扩大修改空间可增强统一多模态模型中的图像精炼能力

相关实体

相关话题