研究人员已经证明,在 AI 系统和人类价值观之间实现完美对齐在数学上是不可能的。这源于形式系统和计算的固有局限性,意味着一些不对齐是结构性的,而不是一个可以修复的错误。提出的解决方案包括创建一个拥有部分重叠目标的多元化 AI 代理生态系统,它们相互监控和约束,从对绝对控制的幻想转向更现实的分布式控制。 AI
影响 建议从完美的 AI 控制转向管理分布式 AI 系统以确保安全。
排序理由 学术论文,提出了关于 AI 安全的理论发现。
- Gödel’s incompleteness theorems
- Hector Zenil
- IEEE Spectrum
- King's College London
- OpenAI
- PNAS Nexus
- Turing’s undecidability result
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →