PulseAugur
实时 21:22:05
English(EN) Learning from Semantic Dictionaries: Discriminative Codebook Contrastive Learning for Unified Visual Representation and Generation

LEASE框架统一视觉表示和生成

研究人员开发了LEASE,一个自监督框架,通过使用成对的生成-判别式码本来统一视觉表示和生成。该方法在离散令牌空间中运行,无需增强或教师模型即可实现高效训练。LEASE在ImageNet-1K上实现了最先进的统一性能,在线性探测、生成质量、少样本学习、迁移任务和鲁棒性方面均优于先前的方法。 AI

影响 在统一视觉表示和生成基准上设定了新的SOTA,可能影响未来的多模态AI发展。

排序理由 该集群包含一篇详细介绍视觉表示和生成新框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

LEASE框架统一视觉表示和生成

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Imanol G. Estepa, Jes\'us M Rodr\'iguez-de-Vera, Bhalaji Nagarajan, Petia Radeva ·

    从语义词典中学习:用于统一视觉表示和生成的判别式码本对比学习

    arXiv:2605.25012v1 Announce Type: new Abstract: Discriminative and generative vision models excel in their respective domains but remain semantically misaligned, hindering progress toward unified visual learning. We introduce LEASE (LEArning from SEmantic Dictionaries), a self-su…