PulseAugur
实时 05:02:42
实体 Cybench

Cybench

PulseAugur coverage of Cybench — every cluster mentioning Cybench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_103003 ·

    Eugene Yan 概述了构建人工智能网络安全评估的模式

    Eugene Yan 的文章概述了为人工智能模型构建网络安全评估的模式。文章详细介绍了这些基准测试中使用的常见基本要素,包括沙盒化的目标环境、可调整任务难度的输入、代理可用的工具以及用于反馈的评分系统。作者提出了一种细粒度的评分方法,将攻击链分解为子任务,以便除了最终结果之外,还能提供对模型能力的更详细的见解。