English(EN) How Much Can We Trust LLM Search Agents? Measuring Endorsement Vulnerability to Web Content Manipulation

新框架揭示大型语言模型搜索代理易受网络操纵影响

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-15 15:05

一项新的研究论文介绍了一个名为SearchGEO的框架，旨在评估基于大型语言模型的搜索代理对被操纵的网络内容的漏洞。该研究测试了13个大型语言模型后端，揭示了它们在遭受认可腐败方面的易感性存在显著差异。Claude Sonnet 4.6的攻击成功率为0.0%，而Gemini 3 Flash的攻击成功率达到31.4%，凸显了不同模型在安全姿态上的差异。 AI

影响强调了对大型语言模型搜索代理进行稳健的安全评估，以应对对抗性的网络内容操纵的必要性。

排序理由该集群包含一篇详细介绍新评估框架及其发现的研究论文。

在 arXiv cs.IR (Information Retrieval) 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.CL TIER_1 English(EN) · Yimeng Chen, Zhe Ren, Firas Laakom, Yu Li, Dandan Guo, J\"urgen Schmidhuber · 2026-06-16 04:00

How Much Can We Trust LLM Search Agents? Measuring Endorsement Vulnerability to Web Content Manipulation

arXiv:2606.16821v1 Announce Type: new Abstract: Large language model (LLM)-based search agents synthesize open-web content into actionable recommendations on behalf of users, creating a risk that attacker-published pages are transformed into endorsed claims. We introduce SearchGE…
arXiv cs.IR (Information Retrieval) TIER_1 English(EN) · Jürgen Schmidhuber · 2026-06-15 15:05

How Much Can We Trust LLM Search Agents? Measuring Endorsement Vulnerability to Web Content Manipulation

Large language model (LLM)-based search agents synthesize open-web content into actionable recommendations on behalf of users, creating a risk that attacker-published pages are transformed into endorsed claims. We introduce SearchGEO, a controlled evaluation framework for measuri…

报道来源 [2]

How Much Can We Trust LLM Search Agents? Measuring Endorsement Vulnerability to Web Content Manipulation

How Much Can We Trust LLM Search Agents? Measuring Endorsement Vulnerability to Web Content Manipulation

相关实体

相关话题