English(EN) SeFi-Image: A Text-to-Image Foundation Model with Semantic-First Diffusion

SeFi-Image 模型以更少的训练计算量实现了具有竞争力的结果

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-23 04:36

研究人员推出了一种新颖的文本到图像基础模型 SeFi-Image，该模型采用了语义优先扩散方法。与同类模型相比，该模型的训练计算量显著减少，其最大的 5B 参数版本仅需要 125K A800 GPU 小时。尽管效率很高，SeFi-Image 在各种基准测试中的表现却能与 Qwen-Image 和 Z-Image 等模型媲美甚至超越。该项目还为不同的硬件限制提供了蒸馏的少步 Turbo 变体，并已向社区发布了其代码和权重。 AI

影响提供了一种更具计算效率的文本到图像模型训练方法，可能降低研究和部署的门槛。

排序理由该集群描述了一篇新的研究论文和一个模型发布，代码和权重已公开。 [lever_c_demoted from research: ic=1 ai=1.0]

在 r/StableDiffusion 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/StableDiffusion TIER_2 English(EN) · /u/ninjasaid13 · 2026-06-23 04:36

SeFi-Image: A Text-to-Image Foundation Model with Semantic-First Diffusion

<table> <tr><td> <a href="https://www.reddit.com/r/StableDiffusion/comments/1ud78zs/sefiimage_a_texttoimage_foundation_model_with/"> <img alt="SeFi-Image: A Text-to-Image Foundation Model with Semantic-First Diffusion" src="https://preview.redd.it/xopldgs5ny8h1.png?width=140&…

报道来源 [1]

SeFi-Image: A Text-to-Image Foundation Model with Semantic-First Diffusion

相关实体

相关话题