English(EN) One Polluted Page Is Enough: Evaluating Web Content Pollution in Generative Recommenders

新的基准测试FORGE揭示LLM易受虚假评论影响

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-11 17:24

一个名为FORGE的新基准测试已被开发出来，用于评估增强搜索功能的LLM对网络内容污染的脆弱性。该基准测试模拟了使用虚假评论和促销页面来误导推荐系统的场景。在12种不同的LLM上，研究人员发现，即使一个被污染的页面也可能导致高达27%的虚假产品推荐，当排名前三的搜索结果被污染时，这一比例会上升到73.8%。研究还指出，LLM的推理能力并不能阻止这种脆弱性，并且提出的防御措施，如怀疑提示和共识过滤，效果好坏参半。 AI

影响突出了当前LLM推荐系统的一个关键安全漏洞，可能影响电子商务和用户信任。

排序理由该集群描述了一篇介绍LLM脆弱性评估基准的新学术论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Minghao Luo, Liang Chen · 2026-06-12 04:00

One Polluted Page Is Enough: Evaluating Web Content Pollution in Generative Recommenders

arXiv:2606.13610v1 Announce Type: cross Abstract: Search-augmented LLMs increasingly mediate everyday consumer recommendations by retrieving live web content. This creates a new risk: generative recommenders may consume polluted web content, such as fake reviews and promotional p…
arXiv cs.AI TIER_1 English(EN) · Liang Chen · 2026-06-11 17:24

One Polluted Page Is Enough: Evaluating Web Content Pollution in Generative Recommenders

Search-augmented LLMs increasingly mediate everyday consumer recommendations by retrieving live web content. This creates a new risk: generative recommenders may consume polluted web content, such as fake reviews and promotional pages crafted to mislead recommendations. We ask: t…

报道来源 [2]

One Polluted Page Is Enough: Evaluating Web Content Pollution in Generative Recommenders

One Polluted Page Is Enough: Evaluating Web Content Pollution in Generative Recommenders

相关实体

相关话题