English(EN) SpatialFlow-GRPO: Where Spatial Credit Drives Image Editing

新框架SpatialFlow-GRPO通过细粒度奖励增强图像编辑

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-25 10:58

研究人员推出了一种新颖的训练框架SpatialFlow-GRPO，旨在通过解决强化学习中全图奖励信号的局限性来提高图像编辑质量。该新方法结合了空间细粒度奖励反馈，将区域感知奖励转换为与策略更新期间特定潜在位置对齐的优化信号。该框架还包括一个名为SFReward的区域感知奖励模型、一个名为SFReward-14K的数据集，以及一个名为MultiEditBench的基准套件，用于评估多区域编辑能力。在OmniGen2和FLUX.2-klein-4B上的实验表明，SpatialFlow-GRPO在多个基准测试中均优于现有的Flow-GRPO方法，通过局部反馈提高了编辑质量。 AI

影响通过在强化学习模型中实现更精确、局部的反馈来提高图像编辑质量。

排序理由该集群描述了一篇详细介绍图像编辑新框架的最新研究论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.CV TIER_1 English(EN) · Yankai Yang, Yancheng Long, Wei Chen, Xingyu Lu, Hongyang Wei, Bin Wen, Fan Yang, Tingting Gao, Han Li, Shuo Yang · 2026-06-26 04:00

SpatialFlow-GRPO: Where Spatial Credit Drives Image Editing

arXiv:2606.26872v1 Announce Type: new Abstract: Recent online reinforcement learning has substantially improved image editing quality. However, existing Flow-GRPO-style methods usually rely on a single whole-image reward, which makes fine-grained editing optimization difficult. W…
arXiv cs.CV TIER_1 English(EN) · Shuo Yang · 2026-06-25 10:58

SpatialFlow-GRPO：空间信用驱动图像编辑

Recent online reinforcement learning has substantially improved image editing quality. However, existing Flow-GRPO-style methods usually rely on a single whole-image reward, which makes fine-grained editing optimization difficult. We observe that a key obstacle in image editing i…

报道来源 [2]

SpatialFlow-GRPO: Where Spatial Credit Drives Image Editing

SpatialFlow-GRPO：空间信用驱动图像编辑

相关实体

相关话题