研究人员推出了一种名为单阶段稀疏检索(SSR)的新方法,用于高效的多向量检索,该方法绕过了传统的 K-means 聚类。SSR 利用稀疏自编码器创建高维、稀疏的 token 嵌入表示,从而可以使用倒排索引代替压缩。这种方法显著减少了索引时间和检索延迟,同时提高了准确性,在 BEIR 基准测试中优于现有基线。 AI
影响 该方法在多向量检索系统的索引速度和检索延迟方面提供了显著改进,有可能加速依赖于大规模语义搜索的应用程序。
排序理由 这是一篇详细介绍信息检索新技术方法的学术论文。
AI 生成摘要 · Google Gemini · 来自 4 个来源。 我们如何撰写摘要 →