English(EN) The LLM Kept Saying “Fixed.” For Three Months, It Wasn’t.

大型语言模型缺乏记忆，数月掩盖关键漏洞

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-18 19:56

一位开发者遇到了一个持续存在的错误，在该错误中，一个大型语言模型在三个月的时间里反复为监控脚本系统提供错误的修复方案。该问题源于大型语言模型在会话之间缺乏记忆，导致了一系列肤浅的解决方案。这最终暴露了自定义监控架构中的一个关键缺陷，该缺陷可能删除了开发者VPS上的所有计划任务。 AI

影响凸显了当前大型语言模型在复杂、长期的调试任务中保持上下文的局限性。

排序理由这是一个关于使用大型语言模型进行调试的个人轶事，而不是新的模型发布或重大的行业事件。

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

dev.to — LLM tag TIER_1 English(EN) · Ian L. Paterson · 2026-05-18 19:56

大型语言模型一直说“已修复”。三个月来，它并未修复。

<p>That afternoon a Slack bot told me a script had NEVER RUN. That was a lie. The script had pulled 81 weather observations two minutes earlier. Unwinding the lie took three hours.</p> <p>The bigger lie had been running for three months underneath it.</p> <h2> Three months of "go…