SpecPL paper introduces spectral granularity for prompt learning in VLMs

作者 PulseAugur 编辑部 · [2 个来源] · 2026-05-06 05:13

Researchers have introduced SpecPL, a novel approach to prompt learning for Vision-Language Models (VLMs) that addresses modality asymmetry by focusing on spectral granularity. This method decomposes visual signals into low-frequency semantic bands and high-frequency detail bands, using a frozen VAE and a Visual Semantic Bank to anchor text representations. Through counterfactual granule training, SpecPL compels models to distinguish visual granularity from semantic invariance, leading to improved fine-grained discrimination. Experiments on 11 benchmarks show SpecPL achieving a new performance ceiling of 81.51% harmonic-mean accuracy and revitalizing existing text-oriented baselines. AI

影响 Introduces a new technique for improving VLM performance by addressing spectral granularity in visual data, potentially enhancing fine-grained discrimination.

排序理由 This is a research paper detailing a new method for prompt learning in VLMs.

在 arXiv cs.CV 阅读 →

VAE
SpecPL

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.LG TIER_1 English(EN) · Jingtao Zhou, Xirui Kang, Feiyang Huang, Lai-Man Po · 2026-05-07 04:00

SpecPL: Disentangling Spectral Granularity for Prompt Learning

arXiv:2605.04504v1 Announce Type: cross Abstract: Existing prompt learning for VLMs exhibits a modality asymmetry, predominantly optimizing text tokens while still relying on frozen visual encoder as holistic extractor and neglecting the spectral granularity essential for fine-gr…
arXiv cs.CV TIER_1 English(EN) · Lai-Man Po · 2026-05-06 05:13

SpecPL: Disentangling Spectral Granularity for Prompt Learning

Existing prompt learning for VLMs exhibits a modality asymmetry, predominantly optimizing text tokens while still relying on frozen visual encoder as holistic extractor and neglecting the spectral granularity essential for fine-grained discrimination. To bridge this, we introduce…

报道来源 [2]

SpecPL: Disentangling Spectral Granularity for Prompt Learning

SpecPL: Disentangling Spectral Granularity for Prompt Learning

相关实体

相关话题