研究人员开发了Ascend-RaBitQ,一个旨在通过利用异构NPU-CPU架构来加速十亿级向量相似性搜索的新型系统。该方法将基于1比特量化向量的NPU粗粒度排序与基于全精度向量的CPU精细排序解耦,克服了传统基于CPU方法的局限性。与仅使用CPU的基线相比,该系统在索引构建速度和吞吐量方面表现出显著的改进,并在分布式多NPU系统上展示了良好的可扩展性。 AI
影响 实现了更高效、可扩展的向量相似性搜索,这对于大规模AI应用至关重要。
排序理由 该集群包含一篇详细介绍新型加速相似性搜索系统的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
在 arXiv cs.IR (Information Retrieval) 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →