实体 AgentThreatBench

AgentThreatBench

PulseAugur coverage of AgentThreatBench — every cluster mentioning AgentThreatBench across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

主题

时间线

2026-05-19 research_milestone AgentThreatBench, the first benchmark for agentic application security, was released and integrated into the UK AI Safety Institute's inspect_evals repository. 来源

最近 · 第 1/1 页 · 共 1 条

RESEARCH · CL_39847 · Jan 29 · 22:12

AI代理面临新的提示注入和后门攻击

研究人员正在开发新的方法来攻击和防御用于软件逆向工程和网络安全的人工智能代理。一种方法使用遗传算法将恶意提示注入AI代理，导致它们误解代码并绕过检测系统。其他研究侧重于检测和混淆这些提示注入攻击，以及防御嵌入代理工作流程中持久控制的多步木马攻击。此外，一个名为CVE-Factory的框架自动化了用于训练和评估代码安全代理的可执行漏洞任务的创建，展示了Qwen3-32B等模型显著的改进。