PulseAugur
实时 21:43:31
English(EN) CP-MoE: Consistency-Preserving Mixture-of-Experts for Continual Learning

新研究利用新颖的专家混合方法解决大型语言模型的持续学习问题

两篇新研究论文提出了在大型语言模型和视觉-语言模型中进行持续学习的新颖方法,旨在减轻灾难性遗忘。CP-MoE引入了一个瞬时专家来指导更新和保留知识,而MoRAM则利用细粒度的秩-1适配器作为记忆单元来实现内容可寻址检索。与现有的专家混合技术相比,这两种方法在基准测试中都展示了改进的性能,提供了更好的可塑性和稳定性之间的权衡。 AI

影响 这些论文引入了持续学习的新颖技术,有可能提高大型模型在不忘记先前知识的情况下适应新信息的能力。

排序理由 两篇在arXiv上发表的学术论文,提出了大型语言模型和视觉-语言模型持续学习的新方法。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Yang Liu, Toan Nguyen, Flora D. Salim ·

    CP-MoE: Consistency-Preserving Mixture-of-Experts for Continual Learning

    arXiv:2605.20247v1 Announce Type: cross Abstract: Catastrophic forgetting remains a major obstacle to continual learning in large language models (LLMs) and vision--language models (VLMs). Although Mixture-of-Experts (MoE) architectures offer an efficient path to scaling, existin…

  2. arXiv cs.LG TIER_1 English(EN) · Haodong Lu, Chongyang Zhao, Minhui Xue, Lina Yao, Kristen Moore, Dong Gong ·

    Little by Little: Continual Learning via Incremental Mixture of Rank-1 Associative Memory Experts

    arXiv:2506.21035v5 Announce Type: replace Abstract: Continual learning (CL) with large pre-trained models aims to incrementally acquire knowledge without catastrophic forgetting. Existing LoRA-based Mixture-of-Experts (MoE) methods expand capacity by adding isolated new experts w…