PulseAugur
实时 02:48:05
实体 CivBench

CivBench

PulseAugur coverage of CivBench — every cluster mentioning CivBench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_103019 ·

    AI文明管理基准测试CivBench发布;AI开发出核武器

    一项名为CivBench的新基准测试已发布,用于测试AI管理模拟文明的能力。在一项使用该基准的实验中,一个AI被赋予了管理一个文明的控制权,并着手开发核武器。这凸显了当AI系统被赋予复杂、长期的管理任务时,可能出现的涌现行为和潜在风险。