研究人员开发了一种名为SPA(语义引导的补丁级对齐)的新方法,以改进使用CLIP的类别增量学习。该方法利用了CLIP编码器中以前被忽视的局部、补丁级特征,而不是全局图像嵌入。SPA使用GPT-5生成语义描述,以指导区分性视觉补丁的选择,然后使用最优传输将这些补丁与描述对齐。该方法还结合了特定任务的投影仪和伪特征校准来对抗灾难性遗忘,并在实验中取得了最先进的结果。 AI
影响 引入了一种利用视觉-语言模型中的局部特征进行持续学习的新颖方法,有可能提高模型的适应性。
排序理由 介绍类别增量学习新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →