一位用户在 r/LocalLLaMA 子版块报告称,与 GLM 5.2 模型进行了一次不寻常的互动,模型主动建议进行上下文压缩。该模型在一个 100 万 token 的上下文窗口内运行,它表示会话变得很重,并为用户提供了在当前上下文继续或开始新会话的选项。这种行为值得注意,因为它似乎是模型在展示对其上下文限制的意识,并主动发起关于管理它们的讨论,而不是用户提示采取此类行动。 AI
影响 表明未来 LLM 有可能更有效地管理自己的上下文,从而改善用户体验。
排序理由 用户报告的模型行为观察,并非正式发布或研究。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →