PulseAugur
实时 19:12:53
实体 CapKV

CapKV

PulseAugur coverage of CapKV — every cluster mentioning CapKV across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_10188 ·

    新理论统一LLM的KV缓存逐出,改善长上下文生成

    研究人员开发了一种新的方法来管理大型语言模型中的KV缓存逐出,该方法借鉴了信息瓶颈原理。这种名为CapKV的方法旨在通过直接针对信息保留来保留缓存中最具预测性的信息。实验表明,与现有的基于启发式的方法相比,CapKV在内存效率和生成质量之间提供了更优的平衡。