研究人员开发了GPUSparse,一个旨在通过利用GPU并行化来加速学习稀疏检索模型的新系统。该系统解决了当前稀疏检索方法中存在的CPU瓶颈问题,该问题阻碍了实时性能。GPUSparse引入了GPU并行倒排索引、批处理的scatter-add评分算法以及融合的Triton内核,在保持高检索质量的同时实现了显著的加速。 AI
影响 这一发展有望实现大规模学习稀疏检索模型的实时服务,从而提高搜索和推荐系统的性能。
排序理由 该条目描述了一个新系统及其在学术论文中提出的性能评估。[lever_c_demoted from research: ic=1 ai=1.0]
在 arXiv cs.IR (Information Retrieval) 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →