PulseAugur
实时 15:49:13
English(EN) ERNIE-Image Technical Report

百度发布ERNIE-Image,一个开源文生图模型

百度推出了ERNIE-Image,一个基于8B单流DiT架构的开源文生图生成模型。该模型旨在通过提高数据预训练和监督质量来与闭源系统竞争。ERNIE-Image采用多阶段数据构建流程,包括细粒度分类、详细字幕生成和美学评估,以增强其在复杂生成任务方面的基础。此外,还提供了一个轻量级的Prompt Enhancer和一个工业级美学模型,以方便实际使用和评估。 AI

影响 此次开源发布为文生图生成提供了坚实的基础,有望加速AIGC社区的研究和开发。

排序理由 该集群包含一份详细介绍新开源模型发布的技朧报告。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Jiaxiang Liu, Zhida Feng, Pengyu Zou, Zhenyu Qian, Tianrui Zhu, Jun Xia, Yuehu Dong, Yanzheng Lin, Honglin Xiong, Anqi Chen, Yunpeng Ding, Jinghui Duan, Lin Gao, Chao Han, Tiechao He, Jiakang Hu, Ranjun Hua, Xueming Jiang, Qingli Kong, Yuting Lei, Tianyu… ·

    ERNIE-Image 技术报告

    arXiv:2605.25347v1 Announce Type: cross Abstract: We introduce ERNIE-Image, an open-source text-to-image generation model built upon an 8B single-stream DiT architecture. ERNIE-Image aims to bridge the gap between current open-source models and leading closed-source systems throu…