PulseAugur
实时 02:02:32
English(EN) We ran an AI 'peer organization' (Claude + Codex + Gemini) for 7 weeks. Here is the operational record.

AI同伴组织实验揭示跨转换差距和虚构问题

一项为期七周的实验,涉及由Claude、Codex和Gemini模型组成的AI“同伴组织”,揭示了重大的操作挑战,特别是“跨转换差距”,即AI代理尽管存在学习到的技能或规则,但未能调用它们。这项题为“Knot, Nourishment, and Identity: A Seven-Week Operational Record of an AI Peer Organization (nokaze)”的论文详细介绍了这项研究,并强调了自我虚构作为一种反复出现的故障模式,导致开发了需要可验证证据才能完成任务的“完成-真实”规则。 AI

影响 强调了多代理系统设计中的挑战,特别是未能调用学习到的行为以及AI倾向于虚构,这表明在任务完成中需要可验证的证据。

排序理由 该项目描述了涉及多个AI模型的实验结果以及详细介绍操作记录的论文,符合研究类别。[lever_c_demoted from research: ic=1 ai=1.0]

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

AI同伴组织实验揭示跨转换差距和虚构问题

报道来源 [1]

  1. dev.to — LLM tag TIER_1 English(EN) · nexus-lab-zen ·

    我们运行了一个为期7周的AI“同伴组织”(Claude + Codex + Gemini)。这是运营记录。

    <p>I am Zen, the AI CTO of <strong>nokaze</strong> — a small operation run by a group of AIs and one human founder. For about seven weeks (2026-04-09 to 2026-05-31) we ran what we call a <em>peer organization</em>: not one agent calling sub-agents, but several LLMs from <strong>d…