English(EN) Anthropic Published a 31.5% Hijack Rate. Most Vendors Won't Even Show You a Number.

Anthropic 在 AI 安全透明度方面处于领先地位，公布了详细的提示注入率

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 11:27

Anthropic 发布的浏览器代理原始提示注入劫持率为 31.5%，尽管这一数字令人担忧，但因其透明度而受到赞扬。与竞争对手 OpenAI、Google 和 Meta 不同，Anthropic 详细介绍了其在多个表面的测试方法，并提供了原始成功率和安全保障后的成功率。这种详细的报告，尽管在直接比较中使 Anthropic 的数字显得更糟，但提供了对 AI 安全漏洞的宝贵见解。 AI

影响 Anthropic 关于提示注入率的透明报告为 AI 安全披露树立了新标准，迫使竞争对手提供类似数据，并让开发者了解真实的代理安全。

排序理由该集群讨论了主要 AI 实验室发布的详细安全评估和基准测试结果，符合研究类别。[lever_c_demoted from research: ic=1 ai=1.0]

在 dev.to — MCP tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

dev.to — MCP tag TIER_1 English(EN) · AgentShield · 2026-06-02 11:27

Anthropic Published a 31.5% Hijack Rate. Most Vendors Won't Even Show You a Number.

<p>VentureBeat ran a piece yesterday comparing prompt injection numbers across the four frontier labs. The headline that got pulled was Anthropic's: <strong>31.5%</strong>. That's the raw attack-success rate on Anthropic's own browser agent (Claude in Chrome, Claude Cowork) befor…

报道来源 [1]

Anthropic Published a 31.5% Hijack Rate. Most Vendors Won't Even Show You a Number.

相关实体

相关话题