研究人员开发了ProCal,一种用于开放词汇目标检测的新颖方法,可在推理时校准分类分数。该方法通过分析预训练的视觉-语言模型(VLMs)区分前景和背景区域的能力来利用它们。ProCal结合了感知定位的前景分数和感知背景的抑制分数,以提高在训练期间未见过的类别的目标定位和分类的准确性。当应用于CLIPSelf ViT-L/14时,ProCal在OV-LVIS数据集上展示了+2.5 APr的显著改进。 AI
影响 提高了对未见类别目标检测的能力,可能增强图像分析和计算机视觉中的应用。
排序理由 该集群描述了一篇提出新颖目标检测方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →