Microsoft Research 开发了一个名为 Lens 的新文本到图像模型,该模型参数量仅为 38 亿,但性能却可与更大的模型相媲美。这种效率归功于使用了 8 亿个由 GPT-4 生成的详细图像描述,而非描述性较差的网页 alt-text。该模型的代码和权重已根据开源许可证发布。 AI
影响 证明了高质量、详细的描述可以显著提高图像生成模型的效率,可能降低训练成本。
排序理由 该集群描述了一个新模型发布,附带了研究发现和开源代码。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →