English(EN) Task-Driven Subspace Decomposition for Knowledge Sharing and Isolation in LoRA-based Continual Learning

新方法通过分离任务特定知识和共享知识来解决LLM的持续学习问题

作者 PulseAugur 编辑部 · [2 个来源] · 2026-05-05 04:00

两篇新的研究论文提出了用于大型语言模型持续学习的新颖方法，解决了在不遗忘先前信息的情况下获取新知识的挑战。第一篇论文《Split-on-Share》引入了一个框架，将模型参数分为任务特定专家和共享专家，并使用弹性权重锚定来保护关键的共享知识。第二篇论文《Task-Driven Subspace Decomposition》专注于低秩适配（LoRA）方法，提出了一种称为LoDA的技术，通过执行任务驱动的分解来解耦知识共享和隔离的方向。这两种方法都旨在与现有的持续学习技术相比，在各种基准测试上提高性能。 AI

影响这些方法可以使LLM能够随着时间的推移学习新技能并适应新数据，而不会丢失先前获得的知识，从而可能带来更通用、更高效的AI系统。

排序理由 arXiv上发表的两篇学术论文提出了大型语言模型持续学习的新方法。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.LG TIER_1 English(EN) · Fatema Siddika, Md Anwar Hossen, Tanwi Mallick, Ali Jannesari · 2026-05-05 04:00

Split-on-Share：用于任务无关的持续学习的稀疏专家混合模型

arXiv:2601.17616v2 Announce Type: replace Abstract: Continual learning in Large Language Models (LLMs) is hindered by the plasticity-stability dilemma, where acquiring new capabilities often leads to catastrophic forgetting of previous knowledge. Existing methods typically treat …
arXiv cs.CV TIER_1 English(EN) · Lingfeng He, De Cheng, Huaijie Wang, Xi Yang, Nannan Wang, Xinbo Gao · 2026-05-05 04:00

用于LoRA基持续学习中知识共享与隔离的任务驱动子空间分解

arXiv:2603.00191v2 Announce Type: replace-cross Abstract: Continual Learning (CL) requires models to sequentially adapt to new tasks without forgetting old knowledge. Recently, Low-Rank Adaptation (LoRA), a representative Parameter-Efficient Fine-Tuning (PEFT) method, has gained …

报道来源 [2]

Split-on-Share：用于任务无关的持续学习的稀疏专家混合模型

用于LoRA基持续学习中知识共享与隔离的任务驱动子空间分解

相关实体

相关话题