English(EN) Revisiting Human-in-the-Loop Object Retrieval with Pre-Trained Vision Transformers

研究人员使用视觉Transformer重新审视人工干预式对象检索

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-30 04:00

研究人员重新审视了人工干预式对象检索（Human-in-the-Loop Object Retrieval）任务，这是一种通过用户反馈迭代查找包含特定对象的图像的方法。该过程涉及系统通过用户标注学习区分相关图像，并由主动学习（Active Learning）循环指导。这种方法对于目标对象小且图像复杂混乱的情况特别有用，论文探讨了使用预训练视觉Transformer（Vision Transformers）的不同表示策略，以平衡全局上下文与局部对象细节。 AI

影响探索了交互式图像检索的新方法，可能改进用户在大型复杂数据集中查找特定对象的方式。

排序理由这是一篇发表在arXiv上的研究论文，详细介绍了一种新的对象检索方法。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Kawtar Zaher, Olivier Buisson, Alexis Joly · 2026-04-30 04:00

重新审视带预训练视觉Transformer的人机协同目标检索

arXiv:2604.00809v2 Announce Type: replace Abstract: Building on existing approaches, we revisit Human-in-the-Loop Object Retrieval, a task that consists of iteratively retrieving images containing objects of a class-of-interest, specified by a user-provided query. Starting from a…

报道来源 [1]

重新审视带预训练视觉Transformer的人机协同目标检索

相关实体

相关话题