PulseAugur
实时 04:01:57
English(EN) Never Seen Before: Benchmarking Genuine Zero-Shot Composed Image Retrieval with Consistent Video-Sourced Datasets

新基准 ZeroSight 测试零样本图像检索

研究人员推出了 ZeroSight,这是一个旨在更严格地评估零样本组合图像检索 (ZS-CIR) 能力的新基准。现有数据集通常使用模型已经训练过的图像,这会损害零样本的前提,并且缺乏参考图像和目标图像之间的一致关系。ZeroSight 利用视频源数据和 LLM 生成的字幕来确保真正的零样本条件和一致的配对,同时还提出了一种名为 SC4CIR 的新方法,通过识别困难的负样本目标来提高性能。 AI

影响 为零样本图像检索建立了更严格的评估方法,可能带来更强大的多模态模型。

排序理由 该集群包含一篇研究论文,介绍了一项特定 AI 任务的新基准和方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Changsheng Xu ·

    前所未见:使用一致的视频来源数据集对真正的零样本组合图像检索进行基准测试

    Zero-Shot Composed Image Retrieval (ZS-CIR) aims to retrieve a target image based on a query composed of a reference image and a relative caption without training samples. Existing ZS-CIR datasets often suffer from complete irrelevance between reference and target images due to n…