retrieval-augmented generation
PulseAugur coverage of retrieval-augmented generation — every cluster mentioning retrieval-augmented generation across labs, papers, and developer communities, ranked by signal.
- instance of Royal Galician Academy 90%
- used by LLM 90%
- used by large-language models 90%
- used by LLMs 90%
- instance of Graphrag 90%
- instance of HotpotQA 90%
- instance of Apium graveolens 90%
- instance of GraphRAG with Knowledge Graphs for Question Answering on Administrative Meeting Records 90%
- uses TigerGraph 90%
- used by large language model 90%
- instance of 2WikiMultiHopQA 90%
- used by Pinecone 90%
- 2026-05-20 research_milestone A developer built a safety-first RAG agent for support tickets, ranking highly in a hackathon. 来源
- 2026-05-10 research_milestone A study empirically analyzed byte-exact deduplication in RAG systems, demonstrating significant context reduction without quality loss. 来源
- 2026-05-10 research_milestone A study assessed RAG and fine-tuning for industrial question-answering applications, finding RAG to be more cost-effective. 来源
- 2026-05-10 research_milestone A study assessed RAG and fine-tuning for industrial question-answering applications, finding RAG to be more cost-effective. 来源
18 天有情绪数据
-
新的TGS-RAG框架通过文本-图协同增强LLM推理能力
研究人员推出了一种新颖的TGS-RAG框架,旨在通过协同整合文本和基于图的信息来改进检索增强生成(RAG)。这种双向方法增强了RAG利用图数据过滤不相关文本证据以及从文本线索重建可能丢失的推理路径的能力。实验表明,TGS-RAG在多跳推理基准测试中优于现有方法,提供了更好的精度和效率平衡。
-
RAG 系统架构在知识库中毒方面表现出不同的鲁棒性
研究人员调查了检索增强生成(RAG)系统在知识库中毒方面的脆弱性,发现系统架构对对抗性鲁棒性有显著影响。在 Natural Questions 数据集上的评估显示,与普通 RAG 系统相比,旨在处理冲突信息(如递归语言模型 RLM)的架构在抵抗中毒攻击方面明显更具抵抗力。研究表明,对于大多数架构而言,对抗性框架而非检索优化是攻击成功的首要驱动因素,突显了内容推理阶段是关键的脆弱点。
-
新的 RAG 系统在性能损失极小的情况下提供位置隐私
研究人员开发了一种名为隐私锚点替换 (PAS) 的新隐私机制,用于空间检索增强生成 (RAG) 系统。PAS 使用相对锚点编码来编码用户位置,而不是直接扰动坐标,这使得与 RAG 管道更好地集成。虽然 PAS 导致检索性能略有下降,但它保持了强大的下游生成质量,并提供粗粒度的隐私保证,对抗性位置误差约为 370-400 米。
-
RAG 使用向量数据库将私有文档与大型语言模型集成,实现语义搜索
本文解释了检索增强生成(RAG)和向量数据库的作用。RAG 涉及将私有文档分解成块,然后由嵌入模型处理以生成代表其语义意义的多维点。向量数据库存储这些点,通过基于余弦相似度等距离度量来识别彼此靠近的点,从而实现语义搜索。当进行查询时,它会被转换为一个点,向量数据库会高效地检索最相关的数据点。
-
医疗 RAG AI 失败,检索到错误的患者数据并导致 85 万美元 HIPAA 罚款
一个使用检索增强生成 (RAG) 的医疗 AI 系统因姓名和医学术语相似,错误地将一名患者的治疗建议提供给了另一名患者。该系统使用了 OpenAI 的 text-embedding-3-large 模型和 Pinecone 作为其向量数据库,在查询 John Smith 的信息时检索到了 Mary Johnson 的糖尿病病史。此错误导致了 85 万美元的 HIPAA 违规,并凸显了纯语义搜索在敏感行业中的风险。
-
RAG分块边界错误导致检索器返回不完整的句子
本文讨论了检索增强生成(RAG)系统中一个常见的问题,即分块边界可能导致检索结果不完整或“半句话”。文章解释了文档如何被分割成更小的片段以供检索,这可能导致系统返回信息碎片而不是完整、连贯的信息。作者认为,仔细管理这些分块边界对于提高RAG应用的准确性和实用性至关重要。
-
Firecrawl 和 Crawl4AI 为 RAG 提供新的网络抓取方法
文章比较了两种专为检索增强生成 (RAG) 管道设计的网络抓取工具 Firecrawl 和 Crawl4AI。文章强调了由于令牌限制、成本和注意力衰减,将原始 HTML 输入 LLM 的挑战。这两种工具都将 DOM 转换为语义 Markdown,但 Firecrawl 为无服务器环境提供了一种托管 API 方法,处理浏览器渲染并提供诸如使用 JSON 模式进行 LLM 内部提取等功能。
-
AI原生开发将焦点从编码转向自然语言提示
AI原生开发正作为一种新范式出现,开发者用自然语言描述期望的结果,而非编写显式代码。这种方法利用提示工程、检索增强生成(RAG)、代理工作流和微调来构建AI驱动的应用程序。虽然不会完全取代开发者,但这种转变将他们定位为专注于AI控制和集成的系统架构师。
-
Build AI Q&A Generator with LangChain, Groq, and FAISS
This project details how to build a Generative AI Question & Answer generator using Python, LangChain, Groq LLMs, Hugging Face Embeddings, and FAISS. The application takes a PDF, extracts content, splits it into managea…
-
ROZA Graphs通过以证据为中心的反馈提高RAG的准确性和效率
研究人员开发了ROZA Graphs,这是一种通过整合以证据为中心的反馈来增强检索增强生成(RAG)系统的新方法。该方法将每个证据的思维链存储为结构化边,使系统能够从过去对特定证据项的判断中学习。该系统通过重用推理路径来提高准确性,并通过修剪一致被拒绝的候选者来提高效率,从而在不改变基础语言模型的情况下,显著提高准确性并降低成本和延迟。
-
LoRA 作为 LLM 的可行参数知识记忆出现,是对 RAG 和 ICL 的补充
一篇新论文探讨了使用低秩适应(LoRA)作为持续更新大型语言模型知识的方法。该研究实证分析了 LoRA 的容量、可组合性以及用于存储和整合信息的优化,并将其与现有的推理时方法(如上下文学习(ICL)和检索增强生成(RAG))进行了对比。研究结果表明,LoRA 提供了一种独特的参数化知识记忆方法,为其操作边界提供了实际指导。
-
开发者使用Ollama和Kimi在C#中构建本地LLM Wiki,作为RAG的替代方案
本教程指导开发者使用C#、Ollama和Kimi模型构建本地LLM Wiki。它将这种方法与检索增强生成(RAG)进行了对比,认为对于小型、稳定的知识库而言,Wiki方法更简单。该过程包括准备文档、通过Ollama将文档发送给LLM以生成结构化内容、将其保存为markdown,然后查询Wiki内容。
-
AutoRAGTuner 框架自动化 RAG 流水线优化并减少代码变更
研究人员开发了 AutoRAGTuner,一个旨在自动化检索增强生成 (RAG) 流水线优化的新框架。这个声明式系统简化了 RAG 架构的构建、执行、评估和调优过程,而这些架构通常很复杂且需要大量手动配置。通过采用模块化设计和自适应贝叶斯优化引擎,AutoRAGTuner 旨在减少工程开销并提高 RAG 系统的可重用性。
-
检索增强LLM提高网络安全事件分析效率
研究人员开发了一个检索增强生成(RAG)系统,以自动化网络安全事件的分析。该系统使用有针对性的查询和MITRE ATT&CK技术库从日志数据中提取指标,然后利用LLM进行语义推理以重建攻击序列。评估显示,不同LLM配置在性能和成本之间存在不同的权衡,Claude Sonnet 4实现了高召回率,而DeepSeek V3提供了显著更低的成本,并且本地部署的Llama 3.1模型提供了零查询成本。
-
新的 E-MIA 攻击通过考试风格查询探测 RAG 系统中的敏感数据
研究人员开发了 E-MIA,一种针对检索增强生成 (RAG) 系统进行成员推理攻击的新颖方法。该技术将目标文档中的可验证证据转换为四种问题类型的考试形式,并使用汇总的考试分数作为信号来推断该文档是否是 RAG 系统知识库的一部分。E-MIA 旨在提高在严格设置下成员和非成员分数的区分度,同时保持隐蔽查询,其性能优于依赖不稳定信号或显眼探测的现有方法。
-
DoGMaTiQ 管道自动化生成用于报告评估的问答片段
研究人员开发了 DoGMaTiQ,这是一个新管道,旨在自动生成用于评估长篇报告的问答(QA)片段,特别是那些由检索增强生成(RAG)系统生成的报告。这一过程解决了手动整理这些评估片段的重大挑战,尤其是在跨语言环境中,这种挑战尤为困难。DoGMaTiQ 系统分三个阶段进行:生成基于文档的片段、对释义进行聚类以及根据质量标准进行子选择。在 TREC 共享任务上的实验表明,DoGMaTiQ 生成的 QA 片段与人类判断具有良好的相关性,并且…
-
Agentic RAG 增强 LLM 检索能力,应对复杂的企业查询
Agentic Retrieval-Augmented Generation (RAG) 通过赋予大型语言模型对检索过程更多的控制权,来增强传统的 RAG 系统。与单一检索步骤不同,Agentic RAG 涉及一个规划和精炼循环,模型可以在其中分解查询、迭代检索信息、选择合适的工具并反思证据。这种方法旨在提高 AI 系统处理复杂、多步骤企业问题的鲁棒性和能力,尽管它也带来了延迟、成本和调试方面的挑战。
-
Agentic RAG 增强 LLM 检索能力,以应对复杂的企业查询
Agentic Retrieval-Augmented Generation (RAG) 通过赋予 LLM 对检索过程更多的控制权来增强传统的 RAG 系统。Agentic RAG 不仅限于单一检索步骤,而是涉及理解、规划、检索、检查和优化等一系列循环。这种方法旨在使 AI 系统在处理复杂、多步骤的企业查询时更强大、更健壮,尽管它可能会增加延迟和成本。
-
IBM 详解保护 AI RAG 工作流的加密方法
IBM 的 Alex Soto 发表了一篇博文,详细介绍了近似距离保持加密 (ADCPE) 如何保护检索增强生成 (RAG) 系统和 AI 应用中的数据。该博文解释了 ADCPE 在这些过程中保护敏感信息的方法。
-
RAG评估系统衡量检索、事实依据和答案忠实度
检索增强生成(RAG)系统虽然因减少幻觉而广受欢迎,但需要超越简单检索指标的强大评估。这些系统包含两个耦合组件:检索器和生成器,两者都可能独立失败。全面的评估应衡量检索质量、上下文相关性、忠实度(答案是否得到上下文支持)、答案正确性和幻觉率。RAGAS等框架提供基于LLM的指标来量化这些方面,确保改进是数据驱动的,并识别出诸如无事实依据的答案或忽略上下文之类的问题。