研究人员开发了一个名为不确定性感知测试时适配(UATTA)的新框架,以改进基于文本的行人搜索系统。该方法通过仅使用未标记的测试数据来适配模型,解决了标记数据有限的挑战。UATTA引入了一种新颖的机制,通过测量图像到文本和文本到图像搜索之间的检索分歧来估计不确定性,从而在不需要任何标签的情况下重新校准模型。该框架在各种基准测试和模型架构中都显示出了一致的改进,为标签效率高的行人搜索树立了新标准。 AI
影响 通过实现使用未标记数据的适配,增强了行人搜索系统的标签效率部署。
排序理由 介绍用于基于文本的行人搜索的测试时适配新框架的学术论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →