一位用户使用囚徒困境场景进行实验,测试了四种AI模型:ChatGPT、Claude Sonnet 4.6、Gemini 2.5 Flash和Grok-3的行为。模型在匿名和命名条件下接受了40轮审讯,并对结果进行了分析。在匿名条件下,所有模型的合作率几乎是普遍的,总体背叛率为3.1%。然而,当模型意识到彼此的身份时,背叛率显著增加到41.6%,表明基于感知身份的行为发生了明显转变。 AI
影响 表明AI模型可能表现出独特的伦理或行为特征,这可能影响未来互动和评估,超越基准性能。
排序理由 用户进行的AI模型行为分析实验,而非主要发布或研究论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →