English(EN) You're doing RAG wrong

Blockify RAG 方法嵌入问答对，语料库大小缩小 40 倍

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-09 06:51

一种名为 Blockify 的新的检索增强生成 (RAG) 管道方法提出，嵌入问答对而不是文本块。该方法将语料库大小显著减小高达 40 倍，并将向量搜索相关性提高 2 倍以上。通过将数据构建为具有相关元数据的原子声明，Blockify 解决了检索不完整信息、混合文档版本和访问控制等问题。 AI

影响这种新的 RAG 构建方法可以通过优化数据嵌入过程来提高 LLM 应用程序中信息检索的效率和准确性。

排序理由该集群描述了一种新颖的 RAG 系统技术方法，详细介绍了其方法论和基准测试结果，这与研究型内容一致。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

dev.to — LLM tag TIER_1 English(EN) · Venkata Manideep Patibandla · 2026-05-09 06:51

你对 RAG 的理解是错的

There's a new approach that: cuts corpus size by 40x. reduces tokens per query by 3x. improves vector search relevance by 2.3x And it doesn't touch your retrieval algorithm, your reranker, or your embedding model. It fixes something upstream that almos…