模型评估与威胁研究(METR)计划发布了一个示例协议,用于评估AI模型潜在的自主性相关风险。该协议侧重于那些能够端到端执行有害任务而无需人工干预的系统,包括那些能够自主寻求人类协助的系统。METR的目标是使评估具有实用性、成本效益,并能在一个月内由一个小团队完成,预算为数百万美元。目的是提供一个危险能力的连续指标,为缓解策略提供信息,并允许社会监督。 AI
影响 提供了一个评估AI自主性风险的框架,可能指导安全投资和开发。
排序理由 这是一篇详细介绍评估AI安全风险新协议的研究论文。
在 METR (Model Evaluation & Threat Research) 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →