研究人员推出了一种新颖的图像生成方法——Flow Matching Adversarial Imitation Learning (FAIL),该方法可将输出分布与高质量目标对齐。与监督微调不同,FAIL在没有昂贵偏好对或显式奖励建模的情况下,解决了未知状态下的策略漂移问题。该框架利用对抗性训练来最小化策略-专家分歧,提供了两种算法:适用于可微分ODE求解器的FAIL-PD和适用于黑盒应用的FAIL-PG。当应用于具有有限演示的FLUX微调时,FAIL在提示遵循和美学基准测试中表现出竞争力,并在离散图像和视频生成中被证明是有效的。 AI
影响 这种新方法通过解决当前训练技术的局限性,有可能提高AI生成图像和视频的质量和控制力。
排序理由 该集群包含一篇详细介绍新图像生成方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]
- arXiv
- Flow Matching Adversarial Imitation Learning
- FLUX
- Hugging Face
- Nano Banana
- supervised fine-tuning
- Yeyao Ma
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →