English(EN) Executing a plan under context constraints

本地LLM用户在执行计划时遇到上下文窗口限制的困境

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-11 02:12

一位用户在使用本地运行的Qwen 3.6 35B-A3B模型时，在执行重构计划过程中遇到了高上下文窗口使用率的问题。在自动压缩发生之前，模型已达到92.6%的上下文窗口利用率。用户正在寻求关于如何在执行计划时管理上下文窗口压力的建议，以防止此类问题的发生，并提出了一些方法，例如在新会话中粘贴之前的计划。 AI

影响用户在使用本地LLM执行复杂计划时，可能需要策略来管理上下文窗口的限制。

排序理由用户讨论关于管理LLM上下文窗口限制的问题。

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/LocalLLaMA TIER_1 English(EN) · /u/mailto_devnull · 2026-06-11 02:12

在上下文约束下执行计划

<div class="md"><p>I'm running Qwen 3.6 35B-A3B via Pi harness on a 32gb unified RAM setup (Framework 13). llama.cpp, 64k context window.</p> <p>I worked with the model to plan through a refactor, and by the time it came time to execute the plan, I was sitting at a…

报道来源 [1]

在上下文约束下执行计划

相关实体

相关话题