PulseAugur
实时 08:12:12
English(EN) Mela: Test-Time Memory Consolidation based on Transformation Hypothesis

Mela语言模型模仿大脑记忆巩固

研究人员推出了一种新颖的、受记忆增强的语言模型Mela,其灵感来源于记忆巩固的神经科学理论。Mela使用分层记忆模块(HMM),该模块具有在不同频率下运行的独立子模块,以捕获抽象和详细信息。这种架构使Mela能够在推理过程中执行在线记忆巩固,从而在不降低性能的情况下处理比标准Transformer模型长得多的上下文。 AI

影响 为语言模型引入了一种新的记忆架构,通过模仿生物记忆巩固来提高长上下文性能。

排序理由 该集群包含一篇详细介绍新颖模型架构的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Mela语言模型模仿大脑记忆巩固

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Lungchuan Chen ·

    Mela: Test-Time Memory Consolidation based on Transformation Hypothesis

    Memory consolidation, the process by which transient experiences are transformed into stable, structured representations, is a foundational organizing principle in the human brain, yet it remains largely unexplored as a design principle for modern sequence models. In this work, w…