PulseAugur
实时 11:36:28
实体 AgentThreatBench

AgentThreatBench

PulseAugur coverage of AgentThreatBench — every cluster mentioning AgentThreatBench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
时间线
  1. 2026-05-19 research_milestone AgentThreatBench, the first benchmark for agentic application security, was released and integrated into the UK AI Safety Institute's inspect_evals repository. 来源
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_39847 ·

    新的基准测试正在应对复杂环境中的 AI 代理安全问题

    研究人员正在开发新的基准测试来解决 AI 代理的安全风险,特别是在多代理和交互式环境中。GT-HarmBench 在博弈论场景中评估前沿模型,揭示了在高风险情况下存在的重大缺陷。Boiling the Frog 和 AgentThreatBench 专注于传统基准测试所忽略的渐进式攻击和间接提示注入,同时评估任务效用和安全性。这些努力旨在为超越简单文本生成的 AI 系统创建更鲁棒的评估方法。