研究人员推出了一种新颖的方法 DiT-Reward,该方法重新利用了预训练的文本到图像扩散 Transformer (DiT) 进行奖励建模。通过处理近乎干净的图像潜在表示并跨 Transformer 层聚合文本条件表示,DiT-Reward 在偏好基准测试上的表现优于 HPSv3 等现有方法。该方法还比 HPSv3 提供了 1.65 倍的推理速度提升,并在用于优化 Stable Diffusion 3.5 Large 等模型时显示出明显的真实感提升。 AI
影响 该方法通过改进奖励建模技术,有望实现更高效、更逼真的 AI 图像生成。
排序理由 介绍文本到图像生成中奖励建模新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →