研究人员开发了一个名为 Text-Guided Q-Former (TGQ-Former) 的新框架,以改进电子商务中的多模态推荐系统。该方法利用结构化元数据来指导从产品图像中提取视觉信息,有助于过滤掉促销叠加和背景杂乱等噪声。实验表明,TGQ-Former 在大规模数据集上将 Hit Rate@100 的平均值提高了 6.04%,显著提高了检索准确性。 AI
影响 通过更好地整合视觉和文本数据来提高商品检索的准确性,从而增强电子商务推荐系统。
排序理由 发表了一篇详细介绍多模态表示学习新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
在 arXiv cs.IR (Information Retrieval) 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →