PulseAugur
实时 18:34:30
English(EN) Help with a Local Document RAG System (Storage + Ingestion + Query + Highlighting)

用户寻求关于构建带有文档高亮功能的本地 RAG 系统的建议

一位用户正在寻求关于构建一个本地、离线的检索增强生成(RAG)系统来处理文档的指导。该系统旨在处理各种文件类型,自动摄取文档,并执行结构化和比较查询。主要挑战包括选择合适的向量数据库(如 Qdrantpgvector),确定在本地运行 GraphRAG 系统(如 Neo4jMicrosoft GraphRAG)的可行性,以及实现一个能够高亮特定文本片段并提供引用的用户界面,类似于抄袭检测工具。 AI

影响 寻求关于构建具有文档高亮和引用等高级功能的本地 RAG 系统的指导。

排序理由 用户寻求关于使用各种工具实现特定技术系统的建议。

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

用户寻求关于构建带有文档高亮功能的本地 RAG 系统的建议

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/PravalPattam12945RPG ·

    Help with a Local Document RAG System (Storage + Ingestion + Query + Highlighting)

    <!-- SC_OFF --><div class="md"><p>Hey folks,</p> <p>I’m working on designing a <strong>local, offline document retrieval + LLM pipeline</strong> and would love your input on the architecture. Here’s what I’m aiming for:</p> <h1>Storage</h1> <ul> <li>Upload <strong>PDF, DOCX, XLSX…