PulseAugur
实时 10:16:22
实体 Anusha Madan Gopal

Anusha Madan Gopal

PulseAugur coverage of Anusha Madan Gopal — every cluster mentioning Anusha Madan Gopal across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_70263 ·

    Transformer QKV 投影共享将 KV 缓存削减 97%

    研究人员探索了 Transformer 架构的查询、键和值 (QKV) 投影的变体,以减少内存使用。他们的研究发现,共享投影,特别是 Q-K=V 变体,可以在对性能影响最小的情况下显著减小 KV 缓存大小。将这些投影共享技术与 GQA 和 MQA 等现有头共享方法相结合,可以大幅减少缓存,使设备端推理更加可行。