研究人员推出了一种新颖的框架NegAS,旨在增强视觉语言模型(VLMs)中分布外(OOD)目标的检测能力。NegAS解决了两个关键挑战:改进注意力机制以更好地识别潜在的OOD区域,以及开发与VLM概率输出兼容的评分函数。该框架利用负标签来指导注意力,并使用基于sigmoid的评分函数来区分分布内和分布外实例,在COCO和OpenImages等数据集上显著提高了OOD检测性能,同时保持了对分布内目标的准确性。 AI
影响 通过增强分布外检测能力,提高了AI系统在安全关键应用中的可靠性。
排序理由 详细介绍一种新目标检测方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →