一篇新论文分析了工业检索管道的架构和部署,重点关注其作为检索即服务(RaaS)层的实现。它强调了延迟、可扩展性和资源限制等生产约束如何影响系统设计。该论文提出了一个统一的RaaS管道抽象,并研究了基于大型语言模型(LLM)的检索机制的集成及其对性能和开销的影响。 AI
排序理由 该集群包含一篇在arXiv上发表的研究论文,详细介绍了工业检索管道的面向系统分析。[lever_c_demoted from research: ic=1 ai=1.0]
在 arXiv cs.IR (Information Retrieval) 阅读 →
- alphaXiv
- arXiv
- CatalyzeX Code Finder for Papers
- CORE Recommender
- DagsHub
- Gotit.pub
- Hugging Face
- large language model
- Retrieval-as-a-Service
- ScienceCast
- Web systems
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →