一份关于超大规模前沿模型记忆遵循的现场报告表明,控制面比模型本身更关键。Anthropic 的 Claude 通过其 SDK 提供了最深入的控制,能够实现更确定的写入。ChatGPT 和 Codex 被认为是紧密的竞争者,尤其通过 AGENTS.md,尽管它们的 SDK 未得到充分探索。相反,Gemini 和 Grok 似乎更依赖于其内部记忆和用户提示,使得外部数据库集成更具挑战性。 AI
影响 强调了系统级控制对于 LLM 记忆遵循的重要性,建议开发者优先选择提供更深入集成能力的模型。
排序理由 这是一篇关于现有模型的现场报告和观点文章,并非新发布或基准测试。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →