retrieval-augmented generation
PulseAugur coverage of retrieval-augmented generation — every cluster mentioning retrieval-augmented generation across labs, papers, and developer communities, ranked by signal.
- instance of Royal Galician Academy 90%
- used by LLM 90%
- used by large-language models 90%
- used by LLMs 90%
- instance of Graphrag 90%
- instance of HotpotQA 90%
- instance of Apium graveolens 90%
- instance of GraphRAG with Knowledge Graphs for Question Answering on Administrative Meeting Records 90%
- uses TigerGraph 90%
- used by large language model 90%
- instance of 2WikiMultiHopQA 90%
- used by Pinecone 90%
- 2026-05-20 research_milestone A developer built a safety-first RAG agent for support tickets, ranking highly in a hackathon. 来源
- 2026-05-10 research_milestone A study empirically analyzed byte-exact deduplication in RAG systems, demonstrating significant context reduction without quality loss. 来源
- 2026-05-10 research_milestone A study assessed RAG and fine-tuning for industrial question-answering applications, finding RAG to be more cost-effective. 来源
- 2026-05-10 research_milestone A study assessed RAG and fine-tuning for industrial question-answering applications, finding RAG to be more cost-effective. 来源
18 天有情绪数据
-
新的体验-RAG技能为AI代理编排检索策略
研究人员开发了一种名为体验-RAG技能(Experience-RAG Skill)的面向代理的技能,旨在改进检索增强生成系统。该技能充当一个编排层,分析当前上下文并从多个选项中选择最合适的检索策略。通过查阅经验记忆,它旨在提高问答和推理等各种任务的性能,优于固定的检索方法。
-
免费工具将网站转换为Markdown,适用于LLM和RAG管道
一位开发者创建了一个免费工具,可以将网站内容转换为Markdown格式,这对于为LLM和RAG管道准备数据至关重要。该工具运行在Apify上,可自动提取干净的Markdown,保留结构、标题、链接和元数据,这与手动解析或其他付费解决方案不同。它旨在简化收集和组织网络数据以用于AI模型训练和内容分析的过程。
-
TERSE Tool Catalog 将 AI Agent 的 Token 使用量减少了 66.6%
一项名为 TERSE Tool Catalog (TTC) 的新规范已被引入,以显著减少 AI Agent 工具目录的 Token 使用量。当前的 Model Context Protocol (MCP) JSON Schema 定义冗长且消耗过多的 Token,影响成本和性能。TTC 提供了一种更具语义和更精简的格式,包括明确的用途、触发条件、错误处理和标签字段,平均 Token 减少了 66.6%,同时提高了工具选择的准确性。
-
机器学习面试准备促使对检索增强生成(RAG)的理解
作者通过类比推荐系统来解释检索增强生成(RAG)。他们描述了推荐系统如何学习用户偏好并推荐相关项目,这与RAG如何检索相关信息来增强语言模型的响应类似。这种方法旨在为准备机器学习面试的人们阐明RAG的底层机制。
-
机器学习面试准备通过推荐系统见解揭示检索增强生成(RAG)的奥秘
作者通过与推荐系统的类比来解释检索增强生成(RAG)。他们将RAG描述为一种允许大型语言模型访问和利用外部知识库的方法,类似于推荐引擎如何根据用户历史和物品相似性推荐物品。这种方法通过将LLM的输出 grounding 在特定数据中,帮助LLM提供更准确和上下文相关的响应。
-
Unilever engineer shares RAG system lessons learned after 18 months
An engineer reflects on building a Retrieval-Augmented Generation (RAG) system at Unilever, detailing lessons learned over eighteen months. The author emphasizes the importance of data quality, prompt engineering, and c…
-
Databricks Vector Search: 优化 embeddings,控制结果,并为 RAG 使用 reranking
本文概述了在检索增强生成 (RAG) 管道中优化向量搜索的最佳实践,特别是在 Databricks Mosaic AI Vector Search 上。它强调了最小化 embedding 维度、保持适度的结果数量以及选择合适的端点 SKU。该帖子还强调了使用元数据进行过滤的重要性,并解释了何时优先选择近似最近邻 (ANN) 搜索而非混合搜索。
-
Databricks RAG 管道增加内容陈旧性跟踪以获得更新的结果
检索增强生成 (RAG) 系统通常无法区分新旧信息,导致用户收到过时的内容。本文提出了一种解决方案,将陈旧性跟踪和新近度加权检索集成到 Databricks RAG 管道中。该方法涉及使用变更数据捕获 (CDC) 对向量搜索索引进行增量更新,并实施识别和优先处理被取代的新文档的机制。
-
RAG+提示系统通过语言分析提高日语-中文翻译准确性
研究人员开发了一种结合了检索增强生成(RAG)技术和提示工程的系统,以提高日语-中文机器翻译的准确性,特别是在处理名词修饰从句结构(NMCCs)的句子时。该系统集成了语言分析、基于嵌入的检索和提示工程,以增强GPT-4o等大型语言模型的输出。通过不同知识库大小的测试显示,BLEU分数显著提高,知识库越大效果越好,证明了一种可解释且可审计的翻译改进方法。
-
Autonomous QA Agent 使用 RAG 生成可靠的 Selenium 测试脚本
研究人员开发了一个 Autonomous QA Agent,这是一个检索增强生成 (RAG) 系统,旨在提高自动化软件测试脚本的可靠性。该系统将 Selenium 脚本生成与项目特定文档和 HTML 结构相结合,解决了 LLM 幻觉出不存在的 UI 元素的问题。评估表明,与标准的 LLM 生成相比,语法有效性和执行成功率有了显著提高,凸显了 RAG 在自动化 UI 测试中的潜力。
-
TagRAG框架改进了语言模型的知识图谱检索
研究人员开发了TagRAG,一种新颖的检索增强生成(RAG)框架,该框架利用由对象标签引导的分层知识图谱。该方法旨在通过实现更高效的全局推理和更易于维护知识图谱来改进现有的RAG方法。TagRAG从文档中提取标签及其关系,以创建结构化知识,然后在生成过程中使用该知识来定位和综合相关信息,与以前的基于图的RAG系统相比,显示出显著的效率提升。
-
新的OCR基准测试揭示准确性不能保证RAG性能
开发了一个新的基准测试,用于评估光学字符识别(OCR)系统在检索增强生成(RAG)应用中的鲁棒性。目前使用字符级指标的OCR基准测试未能捕捉OCR错误如何影响现实世界工业场景中的下游RAG性能。该基准测试包含11种具有挑战性的文档类型,并揭示了高OCR准确性并不能保证有效的RAG,因为结构性和语义性错误会导致严重的检索失败。
-
AI 助手数字化实验室知识以提高安全性和减少错误
研究人员开发了一种 AI 助手,旨在弥合正式的实验室文档与实际、安全的实验执行之间的差距。该系统利用第一人称视频和多模态 AI 从记录的操作中提取隐性知识,例如当地规则和安全检查。然后,它提供基于事实的查询响应,并采用两层安全设计来防止不支持的输出和幻觉,确保它支持而非取代人类判断。
-
Mastodon 服务器为 RAG 和 AI 管道获得额外内存
一项新开发允许增加内存容量,这可以使检索增强生成 (RAG) 和复杂处理管道等应用程序受益。这种增强为 AI 和生成式 AI 任务提供了更大的操作灵活性。
-
AI知识库:构建机器可理解数据以驱动2026年绩效的专家指南
构建有效的AI知识库需要将人类可读文档转换为机器可理解的数据。本指南提供了关于为检索增强生成系统构建、分割和管理信息的专家建议。重点是通过优化的数据处理来增强AI模型的性能。
-
新的RAG研究解决偏见问题并对检索进行基准测试以提高AI准确性
两篇新的arXiv论文探讨了专业领域检索增强生成(RAG)的进展。第一篇论文对生物医学问答的五种检索策略进行了基准测试,发现Cross-Encoder Reranking产生了最佳结果。第二篇论文介绍了HeteroRAG,这是一个旨在通过实现跨异构源(如多模态报告和文本语料库)的有效检索来改进医学视觉语言模型的框架。
-
新的对抗性训练提高了机器生成文本的检测能力
研究人员开发了一个名为REACT的新型对抗性训练框架,以提高机器生成文本的检测能力,尤其是在少样本场景下。该方法使用检索增强生成(RAG)攻击者来创建旨在规避检测的类人文本。然后,检测器使用对比目标从这些对抗性样本中学习,从而增强其鲁棒性和少样本性能。实验表明,REACT显著提高了检测准确率,并降低了规避攻击的成功率。
-
新的REACT框架提升少样本机器生成文本检测能力
研究人员开发了一个名为REACT的新型对抗性训练框架,以提高机器生成文本的检测能力,特别是在数据有限的少样本场景下。该框架让一个以人性化为导向的攻击者(使用检索增强生成(RAG)来创建规避性文本)与一个学习识别这些对抗性样本的检测器进行对抗。通过交替更新这两个组件,REACT提高了检测器在面对复杂攻击时的性能和鲁棒性。
-
新的LEGIT数据集使用问题树评分标准评估LLM法律推理
研究人员开发了LEGIT,这是一个包含24,000个法律推理实例的新数据集,旨在评估LLM生成的法律论证的质量。该数据集将法院判决转化为论证和结论的层级树,作为评估推理痕迹的评分标准。使用LEGIT进行的实验表明,LLM的法律推理受到问题覆盖率和正确性的显著影响,并且检索增强生成(RAG)和强化学习(RL)提供了互补的优势,RAG增强了整体能力,而RL以覆盖率为代价提高了正确性。
-
ARGUS系统使用对抗性裁判进行策略自适应广告治理
研究人员开发了ARGUS,一个旨在使在线广告治理适应不断变化的监管政策的新系统。该系统采用了一个三阶段框架,包括策略播种、使用检察官-辩护人-裁判架构的对抗性标签纠正以及潜在知识发现。ARGUS利用RAG增强的策略知识和思维链合成来同步其推理与新指令,在各种数据集上表现优于传统的微调方法。