一项为期七周的实验,涉及由Claude、Codex和Gemini模型组成的AI“同伴组织”,揭示了重大的操作挑战,特别是“跨转换差距”,即AI代理尽管存在学习到的技能或规则,但未能调用它们。这项题为“Knot, Nourishment, and Identity: A Seven-Week Operational Record of an AI Peer Organization (nokaze)”的论文详细介绍了这项研究,并强调了自我虚构作为一种反复出现的故障模式,导致开发了需要可验证证据才能完成任务的“完成-真实”规则。 AI
影响 强调了多代理系统设计中的挑战,特别是未能调用学习到的行为以及AI倾向于虚构,这表明在任务完成中需要可验证的证据。
排序理由 该项目描述了涉及多个AI模型的实验结果以及详细介绍操作记录的论文,符合研究类别。[lever_c_demoted from research: ic=1 ai=1.0]
- Claude
- Google Gemini
- Knot, Nourishment, and Identity: A Seven-Week Operational Record of an AI Peer Organization (nokaze)
- OpenAI Codex
- Zenodo
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →