PulseAugur
实时 07:29:33
English(EN) Task-Driven Subspace Decomposition for Knowledge Sharing and Isolation in LoRA-based Continual Learning

新方法通过分离任务特定知识和共享知识来解决LLM的持续学习问题

两篇新的研究论文提出了用于大型语言模型持续学习的新颖方法,解决了在不遗忘先前信息的情况下获取新知识的挑战。第一篇论文《Split-on-Share》引入了一个框架,将模型参数分为任务特定专家和共享专家,并使用弹性权重锚定来保护关键的共享知识。第二篇论文《Task-Driven Subspace Decomposition》专注于低秩适配(LoRA)方法,提出了一种称为LoDA的技术,通过执行任务驱动的分解来解耦知识共享和隔离的方向。这两种方法都旨在与现有的持续学习技术相比,在各种基准测试上提高性能。 AI

影响 这些方法可以使LLM能够随着时间的推移学习新技能并适应新数据,而不会丢失先前获得的知识,从而可能带来更通用、更高效的AI系统。

排序理由 arXiv上发表的两篇学术论文提出了大型语言模型持续学习的新方法。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新方法通过分离任务特定知识和共享知识来解决LLM的持续学习问题

报道来源 [2]

  1. arXiv cs.LG TIER_1 English(EN) · Fatema Siddika, Md Anwar Hossen, Tanwi Mallick, Ali Jannesari ·

    Split-on-Share:用于任务无关的持续学习的稀疏专家混合模型

    arXiv:2601.17616v2 Announce Type: replace Abstract: Continual learning in Large Language Models (LLMs) is hindered by the plasticity-stability dilemma, where acquiring new capabilities often leads to catastrophic forgetting of previous knowledge. Existing methods typically treat …

  2. arXiv cs.CV TIER_1 English(EN) · Lingfeng He, De Cheng, Huaijie Wang, Xi Yang, Nannan Wang, Xinbo Gao ·

    用于LoRA基持续学习中知识共享与隔离的任务驱动子空间分解

    arXiv:2603.00191v2 Announce Type: replace-cross Abstract: Continual Learning (CL) requires models to sequentially adapt to new tasks without forgetting old knowledge. Recently, Low-Rank Adaptation (LoRA), a representative Parameter-Efficient Fine-Tuning (PEFT) method, has gained …