PulseAugur
实时 15:52:30
中文(ZH) 全员本科生!何恺明组新作:文生图,258M参数就够了

何恺明本科团队发布MiniT2I文本到图像模型,参数量2.58亿

研究人员,包括由何恺明领导并主要由本科生组成的团队,推出了一种新颖的文本到图像生成模型MiniT2I。该模型以显著更少的参数(2.58亿)和更低的训练成本取得了具有竞争力的结果,与标准的ImageNet实验相当。MiniT2I采用了一种新的MM-JiT架构,直接在像素空间操作,无需VAE,并通过移除AdaLN等机制简化了扩散过程,这些机制在其他大型文本到图像模型中很常见。 AI

影响 展示了一条更高效的文本到图像生成路径,可能降低研发门槛。

排序理由 详细介绍新模型架构及其性能的新研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 量子位 (QbitAI) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. 量子位 (QbitAI) TIER_1 中文(ZH) · henry ·

    All undergraduates! He Kaiming's new work: Text-to-image, 258M parameters are enough

    整篇论文一共六位作者。除了何恺明之外,其余五位都还是本科生。