English(EN) Curriculum Group Policy Optimization: Adaptive Sampling for Unleashing the Potential of Text-to-Image Generation

新的CGPO框架提高了文生图生成的效率

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-18 03:30

研究人员推出了一种新颖的自适应训练框架——课程组策略优化（CGPO），旨在提高文生图模型的效率。该方法通过动态优先考虑与模型当前学习阶段相符的提示，解决了均匀采样的局限性。CGPO利用单个提示生成的图像奖励的方差作为可学习性的指标，增加了具有更高方差的提示的采样概率。此外，还采用了一种类别校准技术来平衡不同数据类别之间的训练难度，从而在GenEval和T2I-CompBench++等基准测试中提高了性能。 AI

影响提高了文生图模型的训练效率，可能带来更快的开发速度和更好的生成质量。

排序理由该集群包含一篇详细介绍改进AI模型训练新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Zhanyu Ma · 2026-05-18 03:30

Curriculum Group Policy Optimization: Adaptive Sampling for Unleashing the Potential of Text-to-Image Generation

Text-to-Image (T2I) generation has achieved remarkable progress in recent years. Meanwhile, reinforcement learning methods, particularly those based on Group Relative Policy Optimization (GRPO), have attracted widespread attention and been successfully applied to T2I tasks. Howev…

报道来源 [1]

Curriculum Group Policy Optimization: Adaptive Sampling for Unleashing the Potential of Text-to-Image Generation

相关实体

相关话题