一篇新论文认为,目前对人类有效的声誉机制,根本不适用于自主语言模型代理。作者认为,这些代理的解离性特征,表现为可变的模块和流动的个性,阻碍了信任所需的持久身份、行为连续性和制裁敏感性。他们提议将基于身份的治理转变为一种基于协议的方法,侧重于可观察性和行为约束。 AI
影响 表明当前对AI代理的信任机制存在缺陷,需要新的方法来确保可靠的委托。
排序理由 该集群包含一篇讨论与AI安全和治理相关的新概念的学术论文。
在 arXiv cs.MA (Multiagent) 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →