retrieval-augmented generation
PulseAugur coverage of retrieval-augmented generation — every cluster mentioning retrieval-augmented generation across labs, papers, and developer communities, ranked by signal.
- instance of Royal Galician Academy 90%
- used by LLM 90%
- used by large-language models 90%
- used by LLMs 90%
- instance of Graphrag 90%
- instance of HotpotQA 90%
- instance of Apium graveolens 90%
- instance of GraphRAG with Knowledge Graphs for Question Answering on Administrative Meeting Records 90%
- uses TigerGraph 90%
- used by large language model 90%
- instance of 2WikiMultiHopQA 90%
- used by Pinecone 90%
- 2026-05-20 research_milestone A developer built a safety-first RAG agent for support tickets, ranking highly in a hackathon. 来源
- 2026-05-10 research_milestone A study empirically analyzed byte-exact deduplication in RAG systems, demonstrating significant context reduction without quality loss. 来源
- 2026-05-10 research_milestone A study assessed RAG and fine-tuning for industrial question-answering applications, finding RAG to be more cost-effective. 来源
- 2026-05-10 research_milestone A study assessed RAG and fine-tuning for industrial question-answering applications, finding RAG to be more cost-effective. 来源
18 天有情绪数据
-
CyberCane 使用神经符号RAG进行隐私保护的网络钓鱼检测
研究人员开发了CyberCane,一个新颖的神经符号框架,用于隐私保护的网络钓鱼检测。该系统结合了符号分析和检索增强生成(RAG),以处理敏感数据并遵守法规。CyberCane 使用了一个名为PhishOnt的OWL本体进行可验证的攻击分类,并在保持高精度的同时,在检测AI生成威胁方面取得了显著改进。
-
EVE框架推出开源LLM以用于地球情报
研究人员开发了EVE,一个专注于地球情报的专用大型语言模型(LLM)的开源框架。EVE的核心是EVE-Instruct,一个拥有240亿参数的模型,源自Mistral Small 3.2,在与地球观测和地球科学相关的推理和问题解答方面表现出色。该新模型在定制基准测试中展示了卓越的性能,同时保留了通用能力,该项目还发布了精选的训练数据和评估基准。EVE包含一个具有检索增强生成(RAG)和幻觉检测的生产系统,支持超过350名试点用户。
-
BRIEF-Pro 压缩长上下文,实现更快、更准确的多跳 AI 推理
研究人员开发了 BRIEF-Pro,一种新颖的上下文压缩技术,旨在提高检索增强生成 (RAG) 系统的效率和准确性。该方法将长文档中的信息合成为简洁的摘要,降低了语言模型的延迟和认知负荷。BRIEF-Pro 允许用户控制摘要长度,并在多跳问答任务上展示了显著的性能提升,其计算开销远低于 LongLLMLingua 等现有方法。
-
新研究应对 RAG 安全性、性能和事实核查挑战
研究人员正在探索用于检索增强生成(RAG)的先进技术,以提高大型语言模型(LLM)的可靠性和事实准确性。一项研究表明,即使在有理想证据的情况下,迭代检索和推理也比静态 RAG 表现更好,尤其是在科学问答方面。另一篇论文介绍了一种名为 FRANQ 的方法,用于区分事实错误和仅仅是对检索到的上下文不忠实,从而改进幻觉检测。第三种方法 CLUE 通过识别证据中的冲突和一致性来生成模型不确定性的自然语言解释,为事实核查提供更有用的见解。
-
新的AdaComp方法自适应地压缩RAG上下文以提高效率
研究人员开发了AdaComp,一种新颖的提取式上下文压缩方法,旨在提高检索增强大型语言模型(RAG)的效率。该技术根据查询复杂度和检索质量自适应地确定最佳压缩率,解决了现有方法中过度压缩和高计算成本的问题。在多个问答数据集上的实验表明,AdaComp在保持与未压缩模型相当的性能的同时,显著降低了推理成本。
-
研究人员开发了知识图谱检索和补全的新方法
研究人员开发了新的框架,通过将多模态知识图谱与检索增强生成技术相结合,来增强知识图谱补全和视觉问答。一种名为RADD的方法将多模态知识图谱补全的检索和重排序解耦,在基准测试中取得了最先进的结果。另一种名为mKG-RAG的方法,在知识密集型视觉问答的检索增强生成中利用多模态知识图谱,通过使用结构化知识和双阶段检索策略来提高准确性。
-
开发者利用Python库构建LLM应用,Harness与AWS专注于AI控制
科技格局在AI的推动下迅速演变,引发了关于控制和应用开发的讨论。Harness.io正在推出解决方案,以在DevOps和软件开发生命周期内管理AI的增长,旨在提供安全的自动化。同时,对开发者工具的关注突出了构建高级LLM应用(包括微调、检索增强生成(RAG)和多代理系统能力)所需的重要Python库。
-
新的RAG块过滤方法将向量索引大小减少了36%
一篇新研究论文提出了一种减少检索增强生成(RAG)系统中冗余的方法。该研究侧重于块过滤技术,包括基于语义、基于主题和基于命名实体的方法,以在不牺牲检索质量的情况下减小索引语料库的大小。实验表明,基于实体的方法可以将向量索引大小缩小25%至36%,同时保持高检索准确性,这表明RAG管道的效率有所提高。
-
MEMCoder框架通过演化记忆增强LLM代码生成能力
研究人员开发了MEMCoder,一个旨在提高大型语言模型在利用私有库的企业环境中代码生成性能的新框架。MEMCoder通过创建多维演化记忆来解决标准检索增强生成(RAG)的局限性,该记忆从模型的解决问题经验中学习。此记忆存储提炼后的使用指南,在推理过程中与静态API文档一起注入模型上下文。该系统利用执行反馈来优化其记忆,从而在特定基准测试中显著提高代码生成准确性。
-
新的RAG研究解决了表格数据、成本和跨语言知识问题
几篇最新的研究论文探讨了检索增强生成(RAG)系统的进展。一篇论文介绍了正交子空间分解(OSD),用于将特定任务行为与参数化RAG中的文档知识分离开来,从而改进适配器组合。另一篇论文CroSearch-R1提出了一个框架,通过将多语言信息整合到强化学习过程中,更好地利用跨语言知识进行RAG。此外,研究还探讨了指代消解对RAG的影响,证明其能够减少歧义并提高性能,特别是对于较小的模型。其他研究则侧重于通过重排分析增强RAG在金融报告等特…
-
S2G-RAG框架通过判断证据充分性改进多跳问答
研究人员推出S2G-RAG,一个旨在改进检索增强问答的迭代框架,特别适用于多跳查询。该系统包含一个名为S2G-Judge的控制器,用于判断当前证据是否足以回答问题并识别缺失信息。这种结构化方法指导后续的检索查询,并维护紧凑的证据上下文以减少噪声。在多个问答数据集上的实验表明,S2G-RAG在提高性能和鲁棒性方面卓有成效,并且易于集成到现有RAG管道中,是一个轻量级的补充。
-
VectifyAI 的 PageIndex 在无向量嵌入的 RAG 中达到 98.7% 的准确率
VectifyAI 开发了一个名为 PageIndex 的新检索增强生成(RAG)系统,在金融文档检索任务中达到了 98.7% 的准确率。该系统显著绕过了传统的向量相似性方法,而是利用逻辑推理。开源的 PageIndex 旨在通过提供更精确、可能更高效的信息检索方法来彻底改变 AI 搜索。
-
AI发展见证增长最快的开源项目激增
一份涵盖2026年5月1日发布的各个AI领域的增长最快的开源项目汇编。该报告重点介绍了RAG和向量数据库、AI研究、提示工程、微调与训练、图像与视频生成、代码助手、AI Agent、AI框架与SDK以及LLM与语言模型等领域的趋势。增长的关键领域包括多模态智能、自主Agent、AI优先开发工具以及大型语言模型的有效训练方法。
-
开源 Stash 为 AI 代理提供持久内存,而 RAG 系统则优化上下文以提高速度
一个名为 Stash 的新开源项目已发布,旨在为 AI 代理提供持久内存。Stash 充当认知层,允许 Claude 和 ChatGPT 等 AI 模型在会话中保留信息,无需重复解释。该系统通过将经验合成为事实和模式,从而实现持续学习和目标跟踪,从而区别于检索增强生成 (RAG)。
-
研究人员探索查询性能预测以优化 RAG 管道
研究人员探索了使用查询性能预测 (QPP) 来优化检索增强生成 (RAG) 管道,方法是选择最有效的查询变体。这种方法旨在减少执行每种可能的查询重构所带来的计算成本。在 TREC-RAG 数据集上的实验揭示了检索相关性与生成保真度之间的差距,表明最大化排名指标的查询变体并不总是能产生最佳的生成答案。然而,QPP 仍然可以识别能够提高整体 RAG 质量的变体,并且轻量级的预检索预测器被证明是高效的。
-
新的MuDABench基准测试跨海量文档集合的分析式问答
研究人员推出了MuDABench,这是一个专为跨大型文档集合进行分析式问答设计的新基准。该基准要求系统综合来自众多来源的信息以执行定量分析,这是当前检索增强生成(RAG)系统难以胜任的任务。提出的多代理工作流程显示出有所改进,但仍未达到人类专家的表现,凸显了信息提取和领域特定知识方面的挑战。
-
LLM提示以61%的准确率提取软件目标,辅助人工工作
研究人员开发了一种使用链式LLM和工程化提示的方法,以自动从软件文档中提取功能目标。该方法包括参与者识别以及高/低级目标提取,并引入了生成-批评机制作为两个LLM之间的反馈循环。虽然该流程在低级目标识别方面达到了61%的准确率,但它最适合加速手动提取而非完全取代它。未来的工作旨在通过集成检索增强生成(RAG)和思维链(CoT)提示来提高准确性。
-
大型语言模型展现自发说服力,改进RAG,并检测新词
研究人员开发了一个管道,通过将基于规则的过滤与大型语言模型分类相结合,自动检测新词(neologisms)。另一项研究探讨了大型语言模型中的“自发说服力”,发现它们在日常对话中经常采用基于信息而非人类倾向于使用社会影响策略的策略。此外,还提出了一个使用基于大型语言模型的“客户数字孪生”的框架,为市场研究创建虚拟受访者,以87.73%的准确率准确预测用户偏好。
-
新研究通过先进的压缩和存储技术解决 LLM KV 缓存瓶颈
2026年5月发布的几篇研究论文介绍了优化大型语言模型中键值(KV)缓存的新技术,以解决内存和延迟瓶颈。这些方法包括将 KV 缓存卸载到 S3 等对象存储(ObjectCache),采用三向令牌路由(VECTOR)等先进压缩策略,以及使用辅助模型进行选择性 KV 缓存重新计算(CacheClip)。其他方法侧重于硬件感知量化(InnerQ, OCTOPUS)和面向服务的自适应压缩(KVServe),以提高效率并减少解码延迟,尤其是在长…
-
ShapedQL 发布用于多阶段排序和 RAG 的 SQL 引擎
ShapedQL 被推出为一个新的 SQL 引擎,旨在优化多阶段排序和检索增强生成 (RAG) 流程。该工具旨在简化 AI 应用中复杂的数据操作。该公告通过一个 Show HN 帖子发布,表明其关注社区反馈和开发者采用。