PulseAugur
实时 17:07:57
实体 W2A16

W2A16

PulseAugur coverage of W2A16 — every cluster mentioning W2A16 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_51029 ·

    新方法通过谱旋转大幅降低大模型量化比特宽度

    研究人员开发了一种名为BBT-spectral的新方法,用于将大语言模型(LLM)量化到极低的比特宽度,特别是W2A16(2比特权重,16比特激活)。该技术利用受影响启发式谱旋转和重建误差量化器,显著降低了困惑度,在各种模型尺寸上比普通自动舍入量化性能高出15-58%。该方法已扩展到解决Qwen3和Qwen2.5等模型的特定架构挑战,证明了其在不同大模型家族中的适应性和有效性。