研究人员开发了一种名为PLATE的新型持续学习方法,旨在无需访问旧任务数据即可适应预训练模型。该方法利用预训练网络中存在的几何冗余来创建更新子空间,从而最大限度地减少功能漂移并提高数据保留率。PLATE通过用结构化低秩矩阵参数化层更新来实现这一点,其中只有一部分矩阵在新任务上进行训练,从而允许在塑性-保留之间进行可控的权衡。 AI
影响 通过消除对旧任务数据的需求,实现了更高效的基础模型适应,有可能在数据稀缺的情况下加速部署。
排序理由 该集群包含一篇详细介绍AI模型持续学习新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- arXiv
- CatalyzeX Code Finder for Papers
- CORE Recommender
- DagsHub
- Gotit.pub
- Hugging Face
- IArxiv Recommender
- PLATE
- Romain Cosentino Dr
- ScienceCast
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →