研究人员开发了SAGA-ReID,通过重新思考CLIP特征的聚合方式来改进行人重识别。这种新方法将中间的patch token与CLIP文本嵌入空间中的anchor vector对齐,有助于强调稳定的身份证据并抑制损坏或缺失的区域,尤其是在遮挡情况下。实验表明,SAGA-ReID的性能显著优于全局池化方法,在遮挡基准测试中Rank-1提升高达+10.6。此外,EV-CLIP提供了一个高效的框架用于少样本视频动作识别,通过使用掩码和上下文提示进行注意力引导和时间建模,解决了低光照条件和以自我为中心的视角等挑战。 AI
影响 这些论文介绍了提高计算机视觉任务(如行人重识别和动作识别)鲁棒性和效率的方法,有可能在具有挑战性的现实条件下实现更好的性能。
排序理由 arXiv上发表了两篇新研究论文,详细介绍了改编和改进现有模型(如CLIP)以用于特定计算机视觉任务的新方法。
AI 生成摘要 · Google Gemini · 来自 5 个来源。 我们如何撰写摘要 →