研究人员推出Air-Know,一种旨在解决组合图像检索(CIR)挑战的新型网络,特别解决了噪声三元组对应(NTC)问题。现有方法在处理NTC固有的语义歧义时遇到困难,导致噪声识别不可靠和表示污染。Air-Know采用“专家-代理-分流”范式,利用多模态大语言模型(MLLMs)创建高精度锚点数据集,引导代理仲裁器,然后根据匹配置信度分流训练数据,以实现清晰的对齐和表示反馈。 AI
影响 引入了一种新方法,通过解决训练数据中的噪声来提高图像检索的准确性,可能使多模态AI应用受益。
排序理由 这是一篇介绍针对特定AI任务的新颖网络和方法的学术论文。
在 Hugging Face Daily Papers 阅读 →
- Air-Know
- Composed Image Retrieval
- MLLMs
- Multimodal Large Language Models
- Noisy Triplet Correspondence
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →