PulseAugur
实时 22:28:00
English(EN) Edit Where You Mean: Region-Aware Adapter Injection for Mask-Free Local Image Editing

新的REDEdit框架通过扩散Transformer实现无掩码局部图像编辑

研究人员开发了REDEdit,一个新颖的适配器框架,旨在提高大型扩散Transformer(DiTs)中局部图像编辑的精度。该系统可以改造现有的DiTs,而无需改变其核心权重,使其能够在指定区域内精确执行编辑。REDEdit通过注入结构化条件流来分离编辑指令和空间位置,利用学习到的SpatialGate进行选择性信号路由,并使用区域感知损失(Region-Aware Loss)将训练集中在修改后的像素上。这种方法在部署时消除了对用户提供的掩码的需求,允许系统直接从指令和源图像预测编辑区域,并在相关基准测试中展示了最先进的性能。 AI

影响 在扩散模型中实现更精确的局部图像编辑,而无需用户提供的掩码。

排序理由 这是一篇详细介绍图像编辑新方法的学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的REDEdit框架通过扩散Transformer实现无掩码局部图像编辑

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Honghao Cai, Xiangyuan Wang, Yunhao Bai, Haohua Chen, Tianze Zhou, Runqi Wang, Wei Zhu, Yibo Chen, Xu Tang, Yao Hu, Zhen Li ·

    Edit Where You Mean: Region-Aware Adapter Injection for Mask-Free Local Image Editing

    arXiv:2604.23763v1 Announce Type: new Abstract: Large diffusion transformers (DiTs) follow global editing instructions well but consistently leak local edits into unrelated regions, because joint-attention architectures offer no explicit channel telling the network where to apply…