研究人员引入了一种名为Latent Terms的新方法,该方法表明密集检索模型可以分解为适用于传统BM25评分的稀疏特征。该技术应用于使用稀疏自编码器的冻结检索器,在无需检索特定调整或监督的情况下,提取了具有齐夫分布统计特征的潜在词汇。Latent Terms在LIMIT基准测试上,其性能与现有的单向量评分方法和SPLADE变体相当或更优,并显著优于其基础模型。 AI
影响 这项研究表明,密集检索模型具有可以利用以提高稀疏检索效率和效果的潜在结构。
排序理由 该集群包含一篇详细介绍信息检索新方法的学术论文。
在 arXiv cs.IR (Information Retrieval) 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →