PulseAugur
实时 07:30:01
English(EN) Benchmarks for Trajectory Safety Evaluation and Diagnosis in OpenClaw and Codex: ATBench-Claw and ATBench-Codex

新基准增强了OpenClaw和Codex中AI代理的安全评估

研究人员开发了ATBench-Claw和ATBench-Codex,它们是ATBench框架的扩展,用于评估代理轨迹的安全性。这些基准分别针对OpenClaw和OpenAI Codex环境进行了定制。定制过程包括分析每个设置,改编三维安全分类法,并使用它来定义基准规范。这种方法允许在代理系统在其执行设置和工具生态系统中不断发展时,进行稳健的安全评估。 AI

影响 为跨不同执行环境的代理轨迹中的安全问题评估和诊断提供了新工具。

排序理由 该集群包含一篇详细介绍AI安全评估新基准的学术论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新基准增强了OpenClaw和Codex中AI代理的安全评估

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Zhonghao Yang, Yu Li, Yanxu Zhu, Tianyi Zhou, Yuejin Xie, Haoyu Luo, Jing Shao, Xia Hu, Dongrui Liu ·

    Benchmarks for Trajectory Safety Evaluation and Diagnosis in OpenClaw and Codex: ATBench-Claw and ATBench-Codex

    arXiv:2604.14858v2 Announce Type: replace Abstract: As agent systems move into increasingly diverse execution settings, trajectory-level safety evaluation and diagnosis require benchmarks that evolve with them. ATBench is a diverse and realistic agent trajectory benchmark for saf…