百度推出了ERNIE-Image,一个基于8B单流DiT架构的开源文生图生成模型。该模型旨在通过提高数据预训练和监督质量来与闭源系统竞争。ERNIE-Image采用多阶段数据构建流程,包括细粒度分类、详细字幕生成和美学评估,以增强其在复杂生成任务方面的基础。此外,还提供了一个轻量级的Prompt Enhancer和一个工业级美学模型,以方便实际使用和评估。 AI
影响 此次开源发布为文生图生成提供了坚实的基础,有望加速AIGC社区的研究和开发。
排序理由 该集群包含一份详细介绍新开源模型发布的技朧报告。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →