PulseAugur
实时 04:12:39
实体 ShortGPT

ShortGPT

PulseAugur coverage of ShortGPT — every cluster mentioning ShortGPT across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_22110 ·

    新研究量化了压缩Transformer中的误差传播

    研究人员开发了一种方法,以更好地理解和管理压缩Transformer模型中的误差传播。通过测量每层输出与输入误差之比(rho),他们发现误差会可预测地累积,解释了为什么压缩早期层会更具破坏性。该分析还揭示了层内组件敏感性存在显著差异,表明重要性分数在不同模型架构之间转移不佳。该研究提出了一种无需训练的方法,利用这些压缩配置文件来指导在层内何处进行压缩以及完全移除哪些层,从而在不显著损失性能的情况下提高效率。