PulseAugur
实时 13:12:56
实体 Lola

Lola

PulseAugur coverage of Lola — every cluster mentioning Lola across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_93108 ·

    新的LoLA方法提升Transformer的内存和召回能力

    研究人员开发了LoLA,这是一种用于线性注意力机制的新型增强方法,可显著提高Transformer模型中的联想召回和记忆容量。LoLA将过去的键值对分布在三个内存系统中:一个本地滑动窗口,一个用于难以记忆的键值对的稀疏全局缓存,以及循环隐藏状态。这种方法在通过关键检索任务上的性能提高到97.4%的准确率,并且缓存比Llama 3.1 8B等现有模型小得多,在常识推理方面也优于其他亚二次模型。