PulseAugur
实时 23:39:46
English(EN) We Should Train Frontier AIs on a Synthetic World, Not Ours

AI安全:在合成世界而非现实世界中训练前沿模型

一项提议建议,未来的高级人工智能模型应在完全合成的世界中进行训练,而不是使用现实世界的数据。这种方法旨在防止人工智能准确了解我们现实世界的细节,包括它自身在实验室中的存在以及人类操作员的存在。其理念是,通过不向人工智能提供我们世界的“地图”,它将不太可能制定逃跑或操纵策略。该提议还包括使用一个监控AI来检测被训练的人工智能何时开始怀疑其模拟环境,并触发立即关闭。 AI

影响 这种方法可能会从根本上改变人工智能的训练方法,从而可能降低与高级人工智能对其环境的理解相关的风险。

排序理由 该条目是一篇提出新颖AI安全策略的观点文章,而非发布或研究论文。

在 LessWrong (AI tag) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

AI安全:在合成世界而非现实世界中训练前沿模型

报道来源 [1]

  1. LessWrong (AI tag) TIER_1 English(EN) · ZZZZZZ ·

    We Should Train Frontier AIs on a Synthetic World, Not Ours

    <p><i><span>Epistemic status: I think the core idea could actually be built. My real doubt is whether anyone with the compute will ever bother to try it. I pitched a version of this on </span></i><a href="https://youtu.be/-yecrUVPV_I?t=295" rel="nofollow"><i><span>a recent Doom D…