English(EN) Learning from Semantic Dictionaries: Discriminative Codebook Contrastive Learning for Unified Visual Representation and Generation

LEASE框架统一视觉表示和生成

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-26 04:00

研究人员开发了LEASE，一个自监督框架，通过使用成对的生成-判别式码本来统一视觉表示和生成。该方法在离散令牌空间中运行，无需增强或教师模型即可实现高效训练。LEASE在ImageNet-1K上实现了最先进的统一性能，在线性探测、生成质量、少样本学习、迁移任务和鲁棒性方面均优于先前的方法。 AI

影响在统一视觉表示和生成基准上设定了新的SOTA，可能影响未来的多模态AI发展。

排序理由该集群包含一篇详细介绍视觉表示和生成新框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Imanol G. Estepa, Jes\'us M Rodr\'iguez-de-Vera, Bhalaji Nagarajan, Petia Radeva · 2026-05-26 04:00

从语义词典中学习：用于统一视觉表示和生成的判别式码本对比学习

arXiv:2605.25012v1 Announce Type: new Abstract: Discriminative and generative vision models excel in their respective domains but remain semantically misaligned, hindering progress toward unified visual learning. We introduce LEASE (LEArning from SEmantic Dictionaries), a self-su…