PulseAugur
实时 10:49:11
实体 Multi-Query Associate Recall

Multi-Query Associate Recall

PulseAugur coverage of Multi-Query Associate Recall — every cluster mentioning Multi-Query Associate Recall across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_82518 ·

    模糊窗口注意力提高了Transformer处理长上下文的效率

    研究人员推出了一种新方法——模糊窗口注意力(BLA),旨在提高Transformer语言模型处理长上下文的效率。BLA通过使用狄利克雷核从频率窗口重建模糊的KV历史,解决了标准Softmax注意力的二次复杂度和不断增长的KV缓存大小限制。该方法在滑动窗口注意力方面提供了状态效率的改进,并在需要信息检索的任务上保持了与其他线性注意力模型相当的性能。