PulseAugur
实时 23:47:15
(CA) Many individual CEVs are probably quite bad

AI对齐辩论:CEV模型可能产生怪物,而不仅仅是善良的神

这篇帖子讨论了“连贯外推意愿”(CEV)的概念,特别是与普京等公众人物的关系。作者质疑CEV的确切定义,认为结果(仁慈或怪物)可能取决于获取知识的顺序与自我修改能力。作者还认为,相当一部分个体可能是“CEV怪物”,他们重视痛苦,而不是大多数人是“CEV好人”只有少数例外的前提。 AI

影响 探讨理论性AI对齐概念,质疑未来AI价值观的性质。

排序理由 这是一篇讨论AI对齐理论概念的观点文章,而非发布或重大事件。

在 LessWrong (AI tag) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

AI对齐辩论:CEV模型可能产生怪物,而不仅仅是善良的神

报道来源 [1]

  1. LessWrong (AI tag) TIER_1 (CA) · Viliam ·

    Many individual CEVs are probably quite bad

    <p><span>I was thinking about </span><a href="https://www.lesswrong.com/posts/FGpDwLwtPfJ3qYbea/vladimir-putin-s-cev-is-probably-not-that-bad" rel="noreferrer"><span>Habryka's article on Putin's CEV</span></a><span>, but I am posting my response here, because the original article…