PulseAugur
实时 23:37:41
实体 Layer 0

Layer 0

PulseAugur coverage of Layer 0 — every cluster mentioning Layer 0 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_06744 ·

    AutoCompress 方法隔离关键 Transformer 层以实现高效压缩

    研究人员开发了 AutoCompress,一种通过隔离和保留关键的第一层(第 0 层)来压缩 Transformer 模型的新颖方法。这种称为关键层隔离(CLI)的方法表明,在较小的 Transformer 中,第 0 层比其他层包含更多与任务相关的关键信息。当应用于 GPT-2 Medium 时,CLI 实现了 2.47 倍的压缩比,参数减少了 59.5%,同时在 WikiText-103 基准测试中保持了强劲的性能。