研究人员开发了LEASE,一个自监督框架,通过使用成对的生成-判别式码本来统一视觉表示和生成。该方法在离散令牌空间中运行,无需增强或教师模型即可实现高效训练。LEASE在ImageNet-1K上实现了最先进的统一性能,在线性探测、生成质量、少样本学习、迁移任务和鲁棒性方面均优于先前的方法。 AI
影响 在统一视觉表示和生成基准上设定了新的SOTA,可能影响未来的多模态AI发展。
排序理由 该集群包含一篇详细介绍视觉表示和生成新框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →