人工智能安全研究组织 METR 详细介绍了其 2023 年的成就,包括开发用于评估自主任务中 AI 代理的方法论,并为 OpenAI 的 GPT-4 系统卡做出贡献。该组织还提出了“负责任的扩展政策”(RSPs),这是一个在 Anthropic 和 OpenAI 等研究人员和公司中获得关注的人工智能安全框架。此外,METR 还与英国人工智能安全研究所合作,并评估了 GPT-5.1 的灾难性风险。 AI
排序理由 METR 的年度回顾详细介绍了研究和评估方法论,包括对系统卡和获得行业采纳的安全框架提案的贡献。
在 METR (Model Evaluation & Threat Research) 阅读 →
- Anthropic
- Eric Schmidt
- Geoffrey Hinton
- GPT-4
- GPT-5.1
- OpenAI
- Responsible Scaling Policies
- UK AI Safety Institute
- White House Executive Order on AI
- Yoshua Bengio
AI 生成摘要 · Google Gemini · 来自 5 个来源。 我们如何撰写摘要 →