PulseAugur
实时 13:49:27
实体 SpecKV

SpecKV

PulseAugur coverage of SpecKV — every cluster mentioning SpecKV across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_05152 ·

    UniVer和SpecKV等新技术通过推测性解码提升LLM推理速度

    研究人员开发了新的方法来加速大型语言模型(LLM)的推理。UniVer为多步和多草稿推测性解码提供了一种统一的方法,将接受长度提高了高达8.5%。推测性解码(SSD)引入了一种并行化验证和推测的方法,其优化的Saguaro算法在自回归解码方面实现了高达5倍的加速。此外,SpecKV引入了一种自适应控制器,该控制器根据模型压缩和草稿模型信号动态选择推测长度,与固定长度推测相比,性能提高了56.0%。