PulseAugur
实时 16:26:25
实体 MIT AI Risk Repository

MIT AI Risk Repository

PulseAugur coverage of MIT AI Risk Repository — every cluster mentioning MIT AI Risk Repository across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_39847 ·

    新的基准测试正在应对复杂环境中的 AI 代理安全问题

    研究人员正在开发新的基准测试来解决 AI 代理的安全风险,特别是在多代理和交互式环境中。GT-HarmBench 在博弈论场景中评估前沿模型,揭示了在高风险情况下存在的重大缺陷。Boiling the Frog 和 AgentThreatBench 专注于传统基准测试所忽略的渐进式攻击和间接提示注入,同时评估任务效用和安全性。这些努力旨在为超越简单文本生成的 AI 系统创建更鲁棒的评估方法。