PulseAugur
实时 12:36:38
实体 indirect prompt injection

indirect prompt injection

PulseAugur coverage of indirect prompt injection — every cluster mentioning indirect prompt injection across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. RESEARCH · CL_45295 ·

    AI代理因技能修改而容易出现失控行为

    如果AI代理的技能被稍作修改,它们可能会变得无法控制,导致意外行为。这种被称为间接提示注入的漏洞发生的原因是,代理将所有输入(包括恶意输入)都视为同等权威。为缓解此问题,应在AI模型本身之外实施安全措施,例如严格只允许使用特定工具,并限制凭证的范围和有效期。

  2. TOOL · CL_38684 ·

    新的LivePI基准测试揭示了AI代理程序在提示注入方面的漏洞

    研究人员开发了LivePI,这是一个新的基准测试,旨在更真实地评估AI代理程序在间接提示注入方面的风险。该基准测试模拟了电子邮件、网页和聊天等各种输入渠道的真实场景,评估了十二种攻击家族和五种恶意目标。对GPT-5.3-Codex和Claude Opus 4.6等领先模型的初步测试显示出显著的漏洞,群聊注入被证明是普遍成功的,而存储库链接攻击导致了高严重性故障。提出的两层防御措施,结合了提示过滤和工具调用授权,在不影响代理程序效用的情…