PulseAugur
实时 13:12:57
实体 Moritz Wagner

Moritz Wagner

PulseAugur coverage of Moritz Wagner — every cluster mentioning Moritz Wagner across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_44754 ·

    LLM剪枝适应方法以更少的计算量媲美再训练

    研究人员开发了一种新的方法来适应剪枝后的大型语言模型(LLMs),称为局部重构。该技术涉及一次适应模型参数的子集,以匹配原始密集模型的激活,即使对于多达720亿参数的模型也证明是有效的。局部重构实现了与完全再训练相当的性能,但需要显著更少的数据和计算量,并且只要包含非线性子模块,其有效性在很大程度上独立于特定的窗口大小。研究还发现,这种适应方法降低了剪枝标准本身的重要性,使得更简单的剪枝技术在更大模型规模下更具竞争力。