English(EN) Byte-Exact Deduplication in Retrieval-Augmented Generation: A Three-Regime Empirical Analysis Across Public Benchmarks

RAG系统中的去重技术在不损失质量的情况下减小了上下文大小

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-10 15:48

一篇新的预印本详细介绍了检索增强生成（RAG）系统中字节精确去重的实证分析。研究发现，在学术、企业和对话式AI用例中，上下文显著减少，多轮对话减少了80.34%。至关重要的是，此去重过程没有引入可衡量的质量下降，这得到了涉及Google Gemini、Anthropic Claude、Meta Llama和OpenAI GPT模型的跨供应商评估的验证，所有模型均达到了严格的质量阈值。 AI

影响展示了一种在不影响输出质量的情况下显著降低RAG系统推理成本的方法，有可能降低AI应用的运营费用。

排序理由该集群包含一篇学术预印本，详细介绍了特定AI技术的实证分析和基准测试结果。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Sietse Schelpe · 2026-05-10 15:48

检索增强生成中的字节精确去重：跨公共基准的三种制度实证分析

This preprint presents an empirical analysis of byte-exact chunk-level deduplication in Retrieval-Augmented Generation (RAG) pipelines. We measure context reduction across three distinct operating regimes: clean academic retrieval (0.16% byte reduction on 22.2M BeIR passages), co…

报道来源 [1]

检索增强生成中的字节精确去重：跨公共基准的三种制度实证分析

相关实体

相关话题