PulseAugur
实时 00:37:14
English(EN) Dissociative Identity: Language Model Agents Lack Grounding for Reputation Mechanisms

论文:大型语言模型代理的解离性破坏基于声誉的信任

一篇新论文认为,目前对人类有效的声誉机制,根本不适用于自主语言模型代理。作者认为,这些代理的解离性特征,表现为可变的模块和流动的个性,阻碍了信任所需的持久身份、行为连续性和制裁敏感性。他们提议将基于身份的治理转变为一种基于协议的方法,侧重于可观察性和行为约束。 AI

影响 表明当前对AI代理的信任机制存在缺陷,需要新的方法来确保可靠的委托。

排序理由 该集群包含一篇讨论与AI安全和治理相关的新概念的学术论文。

在 arXiv cs.MA (Multiagent) 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

论文:大型语言模型代理的解离性破坏基于声誉的信任

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Botao Amber Hu, Helena Rong, Max Van Kleek ·

    分离性身份:语言模型代理缺乏声誉机制的现实基础

    arXiv:2605.30169v1 Announce Type: cross Abstract: As autonomous language model agents proliferate, forming an emerging agentic web with real-world consequences, what credibility signals can you use to decide whether to trust an unfamiliar agent in the wild and delegate to it? A n…

  2. arXiv cs.MA (Multiagent) TIER_1 English(EN) · Max Van Kleek ·

    分离性身份:语言模型代理缺乏声誉机制的接地性

    As autonomous language model agents proliferate, forming an emerging agentic web with real-world consequences, what credibility signals can you use to decide whether to trust an unfamiliar agent in the wild and delegate to it? A natural governance intuition is to extend human ide…