PulseAugur
实时 10:09:08
English(EN) SeFi-Image: A Text-to-Image Foundation Model with Semantic-First Diffusion

SeFi-Image 模型以更少的训练计算量实现了具有竞争力的结果

研究人员推出了一种新颖的文本到图像基础模型 SeFi-Image,该模型采用了语义优先扩散方法。与同类模型相比,该模型的训练计算量显著减少,其最大的 5B 参数版本仅需要 125K A800 GPU 小时。尽管效率很高,SeFi-Image 在各种基准测试中的表现却能与 Qwen-ImageZ-Image 等模型媲美甚至超越。该项目还为不同的硬件限制提供了蒸馏的少步 Turbo 变体,并已向社区发布了其代码和权重。 AI

影响 提供了一种更具计算效率的文本到图像模型训练方法,可能降低研究和部署的门槛。

排序理由 该集群描述了一篇新的研究论文和一个模型发布,代码和权重已公开。 [lever_c_demoted from research: ic=1 ai=1.0]

在 r/StableDiffusion 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

SeFi-Image 模型以更少的训练计算量实现了具有竞争力的结果

报道来源 [1]

  1. r/StableDiffusion TIER_2 English(EN) · /u/ninjasaid13 ·

    SeFi-Image: A Text-to-Image Foundation Model with Semantic-First Diffusion

    <table> <tr><td> <a href="https://www.reddit.com/r/StableDiffusion/comments/1ud78zs/sefiimage_a_texttoimage_foundation_model_with/"> <img alt="SeFi-Image: A Text-to-Image Foundation Model with Semantic-First Diffusion" src="https://preview.redd.it/xopldgs5ny8h1.png?width=140&amp;…