retrieval-augmented generation
PulseAugur coverage of retrieval-augmented generation — every cluster mentioning retrieval-augmented generation across labs, papers, and developer communities, ranked by signal.
- instance of Royal Galician Academy 90%
- used by LLM 90%
- used by large-language models 90%
- used by LLMs 90%
- instance of Graphrag 90%
- instance of HotpotQA 90%
- instance of Apium graveolens 90%
- instance of GraphRAG with Knowledge Graphs for Question Answering on Administrative Meeting Records 90%
- uses TigerGraph 90%
- used by large language model 90%
- instance of 2WikiMultiHopQA 90%
- used by Pinecone 90%
- 2026-05-20 research_milestone A developer built a safety-first RAG agent for support tickets, ranking highly in a hackathon. 来源
- 2026-05-10 research_milestone A study empirically analyzed byte-exact deduplication in RAG systems, demonstrating significant context reduction without quality loss. 来源
- 2026-05-10 research_milestone A study assessed RAG and fine-tuning for industrial question-answering applications, finding RAG to be more cost-effective. 来源
- 2026-05-10 research_milestone A study assessed RAG and fine-tuning for industrial question-answering applications, finding RAG to be more cost-effective. 来源
18 天有情绪数据
-
Judge-R1框架通过代理式信息检索增强法律文书生成
研究人员开发了Judge-R1,一个用于改进法律判决书自动起草的新框架。该系统采用代理式方法收集相关法律信息,并使用一种称为规则指导优化(Rubric-Guided Optimization)的强化学习方法来确保逻辑推理和遵守司法标准。在JuDGE基准上的实验表明,Judge-R1在法律准确性和生成质量方面优于现有方法。
-
检索增强生成(RAG)详解:将 LLM 固定在外部数据中
检索增强生成(RAG)是一种通过允许语言模型访问和整合其原始训练集中不存在的外部数据来增强语言模型的技术。此方法将模型的响应固定在最新或特定的信息上,从而提高准确性和相关性。RAG 对于需要事实一致性和访问当前知识库的应用程序至关重要。
-
医疗 RAG 聊天机器人通过浏览器检查暴露患者数据和系统配置
arXiv 上最近发表的一项研究详细介绍了在利用检索增强生成 (RAG) 的面向患者的医疗聊天机器人中发现的重大隐私和安全漏洞。该研究使用 Claude Opus 4.6 协助评估,发现敏感的系统配置和患者对话数据通过客户端-服务器通信暴露,并且无需身份验证即可检索。研究结果表明,可以使用基本的浏览器检查工具识别此类故障,这凸显了在医疗保健领域部署生成式人工智能之前进行独立安全审查的必要性。
-
CleanBase方法检测RAG知识库中的恶意文档
研究人员开发了CleanBase,一种识别检索增强生成(RAG)知识库中恶意文档的新颖方法。该系统利用为提示注入攻击精心制作的恶意文档之间通常存在的高度语义相似性。CleanBase构建一个相似性图,其中形成团块的文档被标记为恶意,从而增强RAG系统的安全性和完整性。
-
AI智能体自主生成具有自愈能力的ML管道
研究人员开发了一种新颖的多智能体AI系统,旨在自主生成端到端的机器学习管道。该系统利用五个不同的智能体来处理数据分析、理解用户目标、推荐微服务、构建执行图以及管理管道执行等任务。它采用了先进的技术,如代码检索增强生成(RAG)以更好地理解微服务,以及由大型语言模型(LLMs)驱动的自愈机制,以解释和适应执行过程中的错误。
-
Contextual Agentic Memory is a Memo, Not True Memory
研究人员正在探索用于LLM代理的先进记忆系统,以提高其推理和学习能力。一种方法E-mem使用分层架构和多个代理来重建情景上下文,而不会丢失关键信息。另一种方法ViLoMem侧重于双流记忆框架,以分别编码视觉和逻辑信息,使代理能够从成功和失败中学习。此外,一篇论文认为,当前的代理记忆系统仅仅是查找,而不是真正的记忆,并提出了一种受神经科学启发的、用于更好泛化和安全的方法。
-
嵌入式模型弃用时,生产 RAG 管道的实践者指南
本指南解决了生产检索增强生成 (RAG) 管道中使用的嵌入式模型不可避免的弃用问题。它提供了迁移这些系统的实用建议,以维持搜索质量和控制成本。重点是当嵌入式模型不再受支持时,确保平稳过渡的策略。
-
New method distills enterprise knowledge into navigable agent skills for QA
Researchers have developed a new method called Corpus2Skill that enhances Retrieval-Augmented Generation (RAG) by allowing LLM agents to navigate a hierarchical skill directory derived from a document corpus. This appro…
-
确定性法律代理API实现时序知识图谱的可审计推理
研究人员推出了一种名为SAT-Graph API的新API,用于在时序知识图谱上进行可审计推理,特别是在法律领域。该API旨在克服标准检索增强生成(RAG)的局限性,确保法律信息检索不仅保留语义相关性,还保留法律规范的层级、时序和来源。该系统从简单的检索-生成模型转变为主动的推理-行动-观察循环,允许代理分解问题、执行确定性的图操作,并生成基于可审计日志的答案。
-
研究人员推出Auto-ARGUE用于LLM报告生成评估
研究人员推出Auto-ARGUE,一个用于评估大型语言模型(LLM)生成报告质量的新框架,特别关注使用检索增强生成(RAG)的模型。该系统旨在评估引用支持的报告,这是RAG的一个常见应用。在TREC 2024任务上的初步测试表明,Auto-ARGUE与人类判断高度相关,并且发布了一个名为ARGUE-Viz的可视化工具来辅助分析。
-
检索增强型大语言模型通过在电子健康记录中定位证据来改善临床试验招募
研究人员探索了使用检索增强型大语言模型(LLMs)从电子健康记录中识别适合临床试验的患者。该研究评估了包括通用版本和医学适应版本在内的各种LLMs,并测试了处理长文档的策略,例如默认上下文窗口、基于NER的摘要和动态证据检索(RAG)。MedGemma模型结合RAG实现了最高性能,证明了LLMs在提高试验招募效率方面的潜力,特别是对于需要长期推理的标准。
-
LLMs 表现出“锚定虚构”,部分证据会放大自信的幻觉
研究人员发现了一种大型语言模型中的新现象,称为“锚定虚构”(anchored confabulation),其中提供部分证据会适得其反地增加模型自信地产生幻觉的倾向。这种效应被正式表述为参数幻觉置信度(Parametric Hallucination Confidence, PHC),在多个模型家族中均有观察到,并由一项新定律——锚定阈值定律(Anchoring Threshold Law)进行预测。研究结果对检索增强生成(RAG)系…
-
研究评估用于大学项目支持的生成式AI虚拟助手
研究人员开发了一个虚拟助手,以帮助马斯特里赫特大学的学生处理项目规定,解决了常见的LLM问题,如幻觉和不准确的回答。该系统利用检索增强生成(RAG)来整合当前、特定领域的知识,从而提高了答案的可靠性。一个评估框架和实际测试证实了该助手在特定教育背景下满足学生需求的有效性。
-
可视化解释器详细说明了GPU的AI作用和嵌入向量的含义
一个可视化解释器详细说明了图形处理单元(GPU)为何对人工智能任务如此有效,强调了它们在矩阵乘法、并行处理、内存带宽和批处理方面的优势。另一个解释器则解释了嵌入向量如何表示含义,说明了单词到向量的转换以及向量空间中语义相似性的概念。它还触及了检索增强生成(RAG)如何利用向量搜索。
-
Agentic AI 缓存将 LLM 令牌成本降低 60%
面向 Agentic AI 系统的新缓存策略旨在显著降低大型语言模型 (LLM) 的令牌成本,潜在降幅高达 60%。这些方法包括测试时计划缓存和零浪费检索增强生成 (RAG)。目标是随着 Agentic AI 增加令牌使用量,使 AI 部署更具成本效益。
-
NeocorRAG框架优化RAG模型检索质量,达到SOTA性能
研究人员推出NeocorRAG,一个旨在通过关注检索质量而非仅仅召回率来增强检索增强生成(RAG)系统的新型框架。这种新方法利用“证据链”来优化检索,解决了召回率提高并不总是能带来更好的下游推理能力的不足之处。NeocorRAG在HotpotQA和MuSiQue等多个基准测试中展示了最先进的性能,同时使用的token数量远少于现有方法。
-
New RAG system aids navigation of global AI regulations
研究人员开发了一个新的检索增强生成(RAG)系统,旨在帮助用户驾驭复杂的全球人工智能法规格局。该系统处理来自68个司法管辖区的242份文件,包括欧盟人工智能法案和国家人工智能战略等立法。它采用了类型特定的分块、带实体检测的条件检索路由以及基于优先级的重新排序等专业技术来提高准确性。评估表明,该系统在单一司法管辖区和比较性多司法管辖区查询方面均表现良好,展现出高度的忠实度和相关性。
-
研究人员发布 Faithfulness-QA 数据集以训练上下文忠实的 RAG 模型
研究人员开发了 Faithfulness-QA,一个包含近 10 万个样本的新数据集,旨在训练检索增强生成(RAG)模型优先考虑检索到的上下文而非其内部知识。该数据集通过系统地替换现有问答基准中的命名实体为替代项来创建,从而在上下文和参数记忆之间产生冲突。该资源旨在提高 RAG 系统的忠实度,并为其提供评估其上下文基础能力的基准。
-
OntoLogX 利用 LLM 从网络安全日志中提取可操作的威胁情报
研究人员开发了 OntoLogX,这是一个旨在从原始网络安全日志中提取网络威胁情报 (CTI) 的 AI 代理。该系统利用大型语言模型 (LLM) 结合轻量级日志本体和检索增强生成 (RAG),将非结构化日志数据转换为结构化知识图谱 (KG)。OntoLogX 还预测 MITRE ATT&CK 战术,将低级日志证据与更高级别的对手目标联系起来,并在基准和真实数据集上展示了强大的 KG 生成能力和对手活动的准确映射。
-
S2G-RAG 通过判断证据充分性和差距来改进多跳问答
研究人员推出了一种新颖的迭代式框架 S2G-RAG,旨在改进多跳问答的检索增强生成(RAG)。该系统包含一个控制器 S2G-Judge,用于判断当前证据是否足以回答问题并识别缺失的信息。这种结构化方法指导后续的检索查询,并有助于缓解证据不完整或冗余累积等问题。在基准数据集上的实验表明,S2G-RAG 在提高问答性能和鲁棒性方面卓有成效,并且作为一个轻量级组件,可以集成到现有的 RAG 流程中。