新的TN-gram模块提升LLM内存效率

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-06 21:36

研究人员推出了一种名为Tensorized Engram (TN-gram) 的新型大语言模型（LLM）记忆模块，旨在改进模型处理多词组模式的方式。与以往为不同n-gram阶数使用独立记忆结构的方法不同，TN-gram采用标准多项式（Canonical Polyadic）形式的共享因子。这种方法能够更有效地编码n-gram嵌入，并且在参数数量显著减少的情况下，展现出与现有Engram模块相当或更优的性能。 AI

影响这一新的记忆模块有望通过提高LLM处理和回忆多词组序列的能力，从而实现更高效、更强大的LLM。

排序理由该集群包含一篇详细介绍LLM新方法的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.LG TIER_1 English(EN) · Wuyang Zhou, Yuxuan Gu, Giorgos Iacovides, Yuning Qiu, Qibin Zhao, Danilo Mandic · 2026-06-09 04:00

张量化印记：在LLM中跨N-gram嵌入共享潜在表征是有益的

arXiv:2606.08347v1 Announce Type: cross Abstract: Modern language models represent text using discrete token-level embeddings, which forces recurring multi-token patterns to be learned implicitly across Transformer layers. Both Over-tokenized Transformers and Engram attempt to ad…
arXiv cs.CL TIER_1 English(EN) · Danilo Mandic · 2026-06-06 21:36

张量化记忆：N-gram嵌入共享潜在表示在LLM中是有益的

Modern language models represent text using discrete token-level embeddings, which forces recurring multi-token patterns to be learned implicitly across Transformer layers. Both Over-tokenized Transformers and Engram attempt to address this limitation by explicitly incorporating …

报道来源 [2]

张量化印记：在LLM中跨N-gram嵌入共享潜在表征是有益的

张量化记忆：N-gram嵌入共享潜在表示在LLM中是有益的

相关实体

相关话题