研究人员开发了一种名为ChunkGroupSHAP的新方法,以提高信息检索中使用的密集嵌入排序器的可解释性。该技术跨文档对语义相关的文本块进行聚类以创建共享特征,解决了词级别解释与密集表示之间的不匹配问题。在MS MARCO和FinQA等数据集上的实验表明,最佳解释粒度取决于排序器和语料库,这表明需要与表示粒度和语料库结构都保持一致的特征单元。 AI
影响 提高了检索系统的可解释性,可能有助于调试和增强AI驱动的搜索和推荐引擎的信任度。
排序理由 该集群包含一篇详细介绍信息检索新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
在 arXiv cs.IR (Information Retrieval) 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →