新的PAND框架增强了VLM知识蒸馏在视觉分类中的应用

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-03 04:00

研究人员开发了一个名为PAND（Prompt-Aware Neighborhood Distillation）的新框架，以改进将知识从大型视觉语言模型（VLMs）迁移到更小、更高效的网络中，用于细粒度视觉分类的过程。这种两阶段方法将语义校准与结构迁移分开，使用自适应语义锚点和邻域感知蒸馏策略。PAND在多个基准测试中展示了卓越的性能，其中ResNet-18学生模型在CUB-200数据集上实现了显著的准确率提升。 AI

影响通过实现从大型模型到更小模型的更好知识迁移，提高了视觉分类模型的效率。

排序理由这是一篇详细介绍计算机视觉中知识蒸馏新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Qiuming Luo, Yuebing Li, Feng Li, Chang Kong · 2026-06-03 04:00

PAND：用于轻量级细粒度视觉分类的提示感知邻域蒸馏

arXiv:2602.07768v3 Announce Type: replace-cross Abstract: Distilling knowledge from large Vision-Language Models (VLMs) into lightweight networks is crucial yet challenging in Fine-Grained Visual Classification (FGVC), due to the reliance on fixed prompts and global alignment. To…

报道来源 [1]

PAND：用于轻量级细粒度视觉分类的提示感知邻域蒸馏

相关实体

相关话题