PulseAugur
实时 00:51:57
实体 KV-cache eviction

KV-cache eviction

PulseAugur coverage of KV-cache eviction — every cluster mentioning KV-cache eviction across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. COMMENTARY · CL_108502 ·

    AI推理瓶颈从计算转向内存效率

    最近的讨论强调,大型语言模型推理的主要瓶颈不是原始计算能力,而是内存使用效率,特别是KV缓存。像KV缓存逐出和选择性评估等技术的研究表明,可以在没有持续、大量计算的情况下实现智能。这种对更精简推理的关注正推动人们对替代架构的兴趣,例如线性注意力变体、状态空间模型和混合方法,这些方法旨在用固定大小的循环状态替换不断增长的KV缓存。