新的VQ-VAE框架增强图像表示学习

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-13 13:35

研究人员推出了一种新颖的离散图像表示学习框架ArcVQ-VAE。该新方法通过引入球形角度边际先验来增强传统的VQ-VAE模型，该先验鼓励潜在向量之间更大的可分离性。该框架旨在提高码本利用率并捕获更丰富、更多样化的表示，在图像重建和生成任务中表现出有竞争力的性能。 AI

影响引入了一种新的离散图像表示学习方法，有望提高图像重建和生成质量。

排序理由该集群包含一篇详细介绍新颖图像表示学习框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · YoungJoon Yoo · 2026-05-13 13:35

ArcVQ-VAE：具有弧余弦加性裕度的球形向量量化框架

Vector Quantized Variational Autoencoder (VQ-VAE) has become a fundamental framework for learning discrete representations in image modeling. However, VQ-VAE models must tokenize entire images using a finite set of codebook vectors, and this capacity limitation restricts their ab…