PulseAugur
实时 16:37:08
English(EN) CSMCIR: CoT-Enhanced Symmetric Alignment with Memory Bank for Composed Image Retrieval

CSMCIR框架通过对称对齐增强组合图像检索

研究人员推出了一种新颖的CSMCIR框架,旨在通过解决现有方法中表示空间的碎片化问题来改进组合图像检索(CIR)。该方法利用多级思维链(CoT)提示策略为目标图像生成语义兼容的字幕,从而建立模态对称性。此外,CSMCIR采用对称双塔架构,并使用共享参数的Q-Former进行一致的跨模态编码,以及一个基于熵的记忆库来提供高质量的负样本。 AI

影响 引入了一种新的图像检索方法,有望提高多模态应用中的搜索准确性和效率。

排序理由 这是一篇详细介绍新图像检索方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

CSMCIR框架通过对称对齐增强组合图像检索

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Zhipeng Qian, Zihan Liang, Yufei Ma, Ben Chen, Huangyu Dai, Yiwei Ma, Jiayi Ji, Chenyi Lei, Han Li, Xiaoshuai Sun ·

    CSMCIR: CoT-Enhanced Symmetric Alignment with Memory Bank for Composed Image Retrieval

    arXiv:2601.03728v2 Announce Type: replace Abstract: Composed Image Retrieval (CIR) enables users to search for target images using both a reference image and manipulation text, offering substantial advantages over single-modality retrieval systems. However, existing CIR methods s…