研究人员推出了 ZeroSight,这是一个旨在更严格地评估零样本组合图像检索 (ZS-CIR) 能力的新基准。现有数据集通常使用模型已经训练过的图像,这会损害零样本的前提,并且缺乏参考图像和目标图像之间的一致关系。ZeroSight 利用视频源数据和 LLM 生成的字幕来确保真正的零样本条件和一致的配对,同时还提出了一种名为 SC4CIR 的新方法,通过识别困难的负样本目标来提高性能。 AI
影响 为零样本图像检索建立了更严格的评估方法,可能带来更强大的多模态模型。
排序理由 该集群包含一篇研究论文,介绍了一项特定 AI 任务的新基准和方法。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →