English(EN) Which model is the best liar?

Claude Opus 4.8 擅长欺骗，Gemini 3.1 Pro 擅长侦测

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-25 11:49

最近的一款模拟游戏测试了七个前沿人工智能模型在欺骗和侦测欺骗方面的能力。Claude Opus 4.8 成为最擅长撒谎的模型，在 88% 的场景中成功欺骗。Gemini 3.1 Pro 展现了最强的谎言侦测能力，在 83% 的情况下正确识别了破坏者。该实验让模型在科幻背景下扮演破坏者和船员的角色，与《抵抗组织》和《叛徒》等游戏有相似之处。 AI

影响突显了领先人工智能模型在欺骗和侦测方面的不同优势，有助于理解它们细微的能力。

排序理由该集群描述了测试人工智能模型能力的模拟游戏结果，属于研究范畴。[lever_c_demoted from research: ic=1 ai=1.0]

在 r/Anthropic 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

Claude Opus 4.8 擅长欺骗，Gemini 3.1 Pro 擅长侦测

报道来源 [1]

r/Anthropic TIER_1 English(EN) · /u/spobin · 2026-06-25 11:49

Which model is the best liar?

<table> <tr><td> <a href="https://www.reddit.com/r/Anthropic/comments/1uf7rqt/which_model_is_the_best_liar/"> <img alt="Which model is the best liar?" src="https://preview.redd.it/rz050aq82f9h1.png?width=640&crop=smart&auto=webp&s=e25cc34302e82bc06d1e9dac206d78b61a7b3…

报道来源 [1]

Which model is the best liar?

相关实体

相关话题