研究人员开发了一种新颖的查询感知路由框架,以优化过滤式近似最近邻(ANN)搜索。该框架利用轻量级机器学习模型来预测给定查询的各种ANN方法的召回性能。通过查阅离线基准表,系统选择在召回率和每秒查询次数(QPS)之间提供最佳平衡的方法,从而提高效率。该方法在多个数据集上进行了测试,在召回率和QPS平衡方面显著优于现有的过滤式ANN基线,且延迟开销极小。 AI
影响 提高检索系统的效率和准确性,这对于RAG和向量数据库至关重要。
排序理由 阐述新技术方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
在 arXiv cs.IR (Information Retrieval) 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →