English(EN) Linear-DPO: Linear Direct Preference Optimization for Diffusion and Flow-Matching Generative Models

新的Linear-DPO方法改进了文本到图像模型的对齐

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-20 12:54

研究人员推出了一种新颖的文本到图像生成模型对齐方法Linear-DPO。该方法将直接偏好优化目标推广到统一框架内的扩散模型和流匹配模型。通过用线性效用函数替换标准的基于sigmoid的效用函数，并引入EMA更新的参考模型，Linear-DPO在SD1.5和SDXL等扩散模型以及流匹配模型SD3-Medium上的性能优于现有方法。 AI

影响引入了一种更有效的文本到图像模型对齐技术，有望提高其对用户提示的遵循程度。

排序理由该集群包含一篇详细介绍生成模型新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Tao Lan · 2026-05-20 12:54

Linear-DPO：面向扩散和流匹配生成模型的线性直接偏好优化

Direct Preference Optimization (DPO) is successful for alignment in LLMs but still faces challenges in text-to-image generation. Existing studies are confined to denoising diffusion models while overlooking flow-matching, and suffer from an objective mismatch when applying discre…

报道来源 [1]

Linear-DPO：面向扩散和流匹配生成模型的线性直接偏好优化

相关实体

相关话题