研究人员开发了ATBench-Claw和ATBench-Codex,它们是ATBench框架的扩展,用于评估代理轨迹的安全性。这些基准分别针对OpenClaw和OpenAI Codex环境进行了定制。定制过程包括分析每个设置,改编三维安全分类法,并使用它来定义基准规范。这种方法允许在代理系统在其执行设置和工具生态系统中不断发展时,进行稳健的安全评估。 AI
影响 为跨不同执行环境的代理轨迹中的安全问题评估和诊断提供了新工具。
排序理由 该集群包含一篇详细介绍AI安全评估新基准的学术论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →