该论文提出了一个形式化框架,解释了为何个体或AI系统可以从相同的观察集中得出不同的结论。它提出了两个层面的不可识别性:由于推理设置不同而导致结论分歧,以及学习到的世界模型本身的分歧。作者定义了一个“推理画像”来模拟这些差异,并将该框架与深度表示学习的概念联系起来,以AI监管辩论作为案例研究。 AI
影响 提供了一个理论视角来理解和潜在地缓解AI决策和人机交互中的分歧。
排序理由 学术论文发布在arXiv上,详细介绍了理解推理分歧的新理论框架。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →