English(EN) AttnRouter: Per-Category Attention Routing for Training-Free Image Editing on MMDiT

AttnRouter 通过类别注意力路由增强 MMDiT 上的图像编辑

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-05 04:00

研究人员开发了 AttnRouter，一种用于 MMDiT 模型上无训练图像编辑的新颖方法。该方法利用 KVInject，一种单次前向注意力操纵，将源图像的键/值投影混合到噪声流中。AttnRouter 通过使用每类路由表将编辑分派到最有效的操作以保留源结构，从而进一步增强了这一点，显著提高了图像质量。 AI

影响引入了一种更有效、更强大的无训练图像编辑方法，有可能增强生成模型的能力。

排序理由这是一篇详细介绍特定模型图像编辑新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Guandong Li, Mengxia Ye · 2026-05-05 04:00

AttnRouter：用于 MMDiT 无训练图像编辑的每类注意力路由

arXiv:2605.01480v1 Announce Type: new Abstract: We study training-free image editing on Qwen-Image-Edit-2511, a 60-block multi-modal diffusion transformer (MMDiT) that concatenates noise and source-image tokens within a single attention stream. We make three contributions. (i) We…

报道来源 [1]

AttnRouter：用于 MMDiT 无训练图像编辑的每类注意力路由

相关实体

相关话题