r/LocalLLaMA subreddit上的一位用户已成功将本地大型语言模型的上下文窗口限制推至256k token以上。该用户手动将自动压缩设置为341.5k token,目前正通过优化内存驱逐来进一步提高上限。这项进展归功于Apple、DeepSeek和oMLX的贡献。 AI
影响 展示了本地运行的LLM拥有显著更大上下文窗口的潜力。
排序理由 用户驱动的研究正在突破现有模型能力的界限。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →