PulseAugur
实时 10:58:56
English(EN) AttnRouter: Per-Category Attention Routing for Training-Free Image Editing on MMDiT

AttnRouter 通过类别注意力路由增强 MMDiT 上的图像编辑

研究人员开发了 AttnRouter,一种用于 MMDiT 模型上无训练图像编辑的新颖方法。该方法利用 KVInject,一种单次前向注意力操纵,将源图像的键/值投影混合到噪声流中。AttnRouter 通过使用每类路由表将编辑分派到最有效的操作以保留源结构,从而进一步增强了这一点,显著提高了图像质量。 AI

影响 引入了一种更有效、更强大的无训练图像编辑方法,有可能增强生成模型的能力。

排序理由 这是一篇详细介绍特定模型图像编辑新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

AttnRouter 通过类别注意力路由增强 MMDiT 上的图像编辑

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Guandong Li, Mengxia Ye ·

    AttnRouter: Per-Category Attention Routing for Training-Free Image Editing on MMDiT

    arXiv:2605.01480v1 Announce Type: new Abstract: We study training-free image editing on Qwen-Image-Edit-2511, a 60-block multi-modal diffusion transformer (MMDiT) that concatenates noise and source-image tokens within a single attention stream. We make three contributions. (i) We…