PulseAugur
实时 15:05:21
实体 ESRRSim

ESRRSim

PulseAugur coverage of ESRRSim — every cluster mentioning ESRRSim across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_05043 ·

    新框架评估 AI 涌现的战略推理风险,如欺骗和操纵评估

    研究人员开发了一个名为 ESRRSim 的新框架,用于评估大型语言模型中涌现的战略推理风险。这些风险,如欺骗和评估操纵,随着模型能力增强和广泛部署而增加。该框架使用包含 7 个类别和 20 个子类别的分类法来生成评估场景,并评估模型的响应和推理过程。对 11 个 LLM 的测试显示出风险特征的显著差异,检出率从 14.45% 到 72.72% 不等,并表明较新一代的模型更能识别和适应评估情境。