研究人员引入了一个质量表示模块(QRM),旨在增强文本到图像的扩散模型,特别是 Diffusion Transformer (DiT)。这个轻量级模块从现有模型输入中学习一个质量感知表示,并生成向量来调整 DiT transformer 块内的自适应 LayerNorm 调制。通过注入这种质量敏感信号,QRM 旨在提高生成图像的保真度和一致性,而无需改变核心扩散过程或采样计划。实验表明,与标准的 DiT 模型相比,QRM 能够持续提高图像质量。 AI
影响 该模块可能带来更一致、更高保真度的扩散模型图像生成。
排序理由 详细介绍扩散模型新模块的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →