PulseAugur
实时 13:32:12

新的TN-gram模块提升LLM内存效率

研究人员推出了一种名为Tensorized Engram (TN-gram) 的新型大语言模型(LLM)记忆模块,旨在改进模型处理多词组模式的方式。与以往为不同n-gram阶数使用独立记忆结构的方法不同,TN-gram采用标准多项式(Canonical Polyadic)形式的共享因子。这种方法能够更有效地编码n-gram嵌入,并且在参数数量显著减少的情况下,展现出与现有Engram模块相当或更优的性能。 AI

影响 这一新的记忆模块有望通过提高LLM处理和回忆多词组序列的能力,从而实现更高效、更强大的LLM。

排序理由 该集群包含一篇详细介绍LLM新方法的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.LG TIER_1 English(EN) · Wuyang Zhou, Yuxuan Gu, Giorgos Iacovides, Yuning Qiu, Qibin Zhao, Danilo Mandic ·

    张量化印记:在LLM中跨N-gram嵌入共享潜在表征是有益的

    arXiv:2606.08347v1 Announce Type: cross Abstract: Modern language models represent text using discrete token-level embeddings, which forces recurring multi-token patterns to be learned implicitly across Transformer layers. Both Over-tokenized Transformers and Engram attempt to ad…

  2. arXiv cs.CL TIER_1 English(EN) · Danilo Mandic ·

    张量化记忆:N-gram嵌入共享潜在表示在LLM中是有益的

    Modern language models represent text using discrete token-level embeddings, which forces recurring multi-token patterns to be learned implicitly across Transformer layers. Both Over-tokenized Transformers and Engram attempt to address this limitation by explicitly incorporating …