PulseAugur
实时 08:39:00
English(EN) Show, Don't Ask: Generative Visual Disambiguation for Composed Image Retrieval with Turn-Valid Coverage

新的 CLARA 框架使用视觉替代方案来解决图像检索歧义

研究人员推出了一种新颖的框架 CLARA,旨在解决组合图像检索 (CIR) 中的歧义问题。与依赖基于文本的澄清的先前方法不同,CLARA 向用户展示一小部分视觉替代方案。这种方法允许用户直接选择最符合其意图的图像,从而无需模型预测文本答案。CLARA 通过根据用户选择重新加权校准并确保显示的原型基于真实语料库图像,从而在多个交互轮次中保持一致性保证。 AI

影响 这项研究通过提供更直观的消歧过程,有可能改善图像搜索应用中的用户体验和准确性。

排序理由 详细介绍一种新的图像检索方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Sui Yang Guang ·

    展示,而非询问:用于组合图像检索的生成式视觉消歧与回合有效覆盖

    Composed image retrieval (CIR) uses a reference image and a text modification to search for a target image. However, such queries often describe several possible images rather than one exact target, making the user's intent ambiguous. Recent methods address this by using conforma…