English(EN) Dissociative Identity: Language Model Agents Lack Grounding for Reputation Mechanisms

论文：大型语言模型代理的解离性破坏基于声誉的信任

作者 PulseAugur 编辑部 · [2 个来源] · 2026-05-28 16:20

一篇新论文认为，目前对人类有效的声誉机制，根本不适用于自主语言模型代理。作者认为，这些代理的解离性特征，表现为可变的模块和流动的个性，阻碍了信任所需的持久身份、行为连续性和制裁敏感性。他们提议将基于身份的治理转变为一种基于协议的方法，侧重于可观察性和行为约束。 AI

影响表明当前对AI代理的信任机制存在缺陷，需要新的方法来确保可靠的委托。

排序理由该集群包含一篇讨论与AI安全和治理相关的新概念的学术论文。

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Botao Amber Hu, Helena Rong, Max Van Kleek · 2026-05-29 04:00

分离性身份：语言模型代理缺乏声誉机制的现实基础

arXiv:2605.30169v1 Announce Type: cross Abstract: As autonomous language model agents proliferate, forming an emerging agentic web with real-world consequences, what credibility signals can you use to decide whether to trust an unfamiliar agent in the wild and delegate to it? A n…
arXiv cs.MA (Multiagent) TIER_1 English(EN) · Max Van Kleek · 2026-05-28 16:20

分离性身份：语言模型代理缺乏声誉机制的接地性

As autonomous language model agents proliferate, forming an emerging agentic web with real-world consequences, what credibility signals can you use to decide whether to trust an unfamiliar agent in the wild and delegate to it? A natural governance intuition is to extend human ide…