研究人员开发了 KV-Fold,一种无需重新训练即可扩展大型语言模型上下文窗口的新颖方法。该技术将键值缓存视为函数式编程风格的折叠中的累加器,使模型能够处理数据序列块,同时保持稳定的内部状态。KV-Fold 在各种上下文长度和模型大小的“针尖麦芒”基准测试中展示了 100% 的精确匹配检索,并且运行在单个 GPU 的内存限制内。 AI
影响 使 LLM 能够在不进行昂贵重新训练的情况下处理更长的上下文,从而可能提高需要广泛背景信息的任务的性能。
排序理由 该集群包含一篇详细介绍 LLM 推理新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →