研究人员推出 PixelU,这是一种新颖的 U 型扩散 Transformer,专为高效的端到端像素扩散而设计。该模型通过关注 $x$-预测范式而非 $v$-预测,挑战了像素空间扩散中复杂解码器的必要性。PixelU 利用零成本跳跃连接直接路由高频细节,并采用恒定通道空间下采样机制来分离低频语义。在 ImageNet 上的实验表明,PixelU 在计算成本显著降低的情况下,取得了与现有方法相比具有竞争力的 FID 分数。 AI
影响 引入了一种计算效率更高的像素扩散模型方法,有可能加速生成图像合成领域的研究和开发。
排序理由 该集群描述了一篇详细介绍新颖模型架构和技术的新学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →