CleanBase method detects malicious documents in RAG knowledge databases

By PulseAugur Editorial · [2 sources] · 2026-05-01 06:51

Researchers have developed CleanBase, a novel method to identify malicious documents within retrieval-augmented generation (RAG) knowledge databases. The system leverages the high semantic similarity often found among malicious documents crafted for prompt injection attacks. CleanBase constructs a similarity graph where documents forming cliques are flagged as malicious, thereby enhancing the security and integrity of RAG systems. AI

IMPACT Enhances RAG system security by detecting and mitigating prompt injection attacks through malicious document identification.

RANK_REASON This is a research paper detailing a new method for detecting malicious documents in RAG systems.

Read on arXiv cs.LG →

paper
safety

AI-generated summary · Google Gemini · from 2 sources. How we write summaries →

COVERAGE [2]

arXiv cs.LG TIER_1 English(EN) · Weifei Jin, Xilong Wang, Wei Zou, Jinyuan Jia, Neil Gong · 2026-05-04 04:00

CleanBase: Detecting Malicious Documents in RAG Knowledge Databases

arXiv:2605.00460v1 Announce Type: cross Abstract: Retrieval-augmented generation (RAG) is vulnerable to prompt injection attacks, in which an adversary inserts malicious documents containing carefully crafted injected prompts into the knowledge database. When a user issues a ques…
arXiv cs.LG TIER_1 English(EN) · Neil Gong · 2026-05-01 06:51

CleanBase: Detecting Malicious Documents in RAG Knowledge Databases

Retrieval-augmented generation (RAG) is vulnerable to prompt injection attacks, in which an adversary inserts malicious documents containing carefully crafted injected prompts into the knowledge database. When a user issues a question targeted by the attack, the RAG system may re…

COVERAGE [2]

CleanBase: Detecting Malicious Documents in RAG Knowledge Databases

CleanBase: Detecting Malicious Documents in RAG Knowledge Databases

RELATED ENTITIES

RELATED TOPICS