PulseAugur
实时 09:42:56
实体 TFGN

TFGN

PulseAugur coverage of TFGN — every cluster mentioning TFGN across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_29713 ·

    新架构应对LLM的灾难性遗忘问题

    研究人员开发了新的架构方法,以解决大型语言模型(LLM)在持续预训练和微调过程中出现的灾难性遗忘问题。其中一种方法TFGN引入了一个叠加层,可以在不改变核心Transformer的情况下实现参数高效更新,在不同领域和模型规模下均能显著保留先前的知识。另一种受生物视觉启发的UAM方法,采用双流架构将语义理解与动作控制分离,在VLA模型训练过程中保持多模态能力。这些进展旨在使模型能够持续学习,而不会降低先前获得的知识的性能。