研究人员开发了一种名为COMBINER的新方法,用于组合图像检索(CIR),旨在通过多模态输入提高定位特定图像的准确性。该方法通过基于属性原型创建跨模态特征的统一表示,解决了视觉上相似的图像可能具有不同属性的挑战。COMBINER利用自适应语义解耦、统一原型组合和对偶关系建模的模块来更好地理解样本之间的语义关系。 AI
排序理由 该集群包含一篇详细介绍新图像检索方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →