研究人员开发了REDEdit,一个新颖的适配器框架,旨在提高大型扩散Transformer(DiTs)中局部图像编辑的精度。该系统可以改造现有的DiTs,而无需改变其核心权重,使其能够在指定区域内精确执行编辑。REDEdit通过注入结构化条件流来分离编辑指令和空间位置,利用学习到的SpatialGate进行选择性信号路由,并使用区域感知损失(Region-Aware Loss)将训练集中在修改后的像素上。这种方法在部署时消除了对用户提供的掩码的需求,允许系统直接从指令和源图像预测编辑区域,并在相关基准测试中展示了最先进的性能。 AI
影响 在扩散模型中实现更精确的局部图像编辑,而无需用户提供的掩码。
排序理由 这是一篇详细介绍图像编辑新方法的学术论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →