中文(ZH) 全员本科生！何恺明组新作：文生图，258M参数就够了

何恺明本科团队发布MiniT2I文本到图像模型，参数量2.58亿

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-18 09:12

研究人员，包括由何恺明领导并主要由本科生组成的团队，推出了一种新颖的文本到图像生成模型MiniT2I。该模型以显著更少的参数（2.58亿）和更低的训练成本取得了具有竞争力的结果，与标准的ImageNet实验相当。MiniT2I采用了一种新的MM-JiT架构，直接在像素空间操作，无需VAE，并通过移除AdaLN等机制简化了扩散过程，这些机制在其他大型文本到图像模型中很常见。 AI

影响展示了一条更高效的文本到图像生成路径，可能降低研发门槛。

排序理由详细介绍新模型架构及其性能的新研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在量子位 (QbitAI) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

量子位 (QbitAI) TIER_1 中文(ZH) · henry · 2026-06-18 09:12

All undergraduates! He Kaiming's new work: Text-to-image, 258M parameters are enough

整篇论文一共六位作者。除了何恺明之外，其余五位都还是本科生。

报道来源 [1]

All undergraduates! He Kaiming's new work: Text-to-image, 258M parameters are enough

相关实体

相关话题