PulseAugur
实时 11:49:48
实体 CKA-QAD

CKA-QAD

PulseAugur coverage of CKA-QAD — every cluster mentioning CKA-QAD across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_72732 ·

    新的蒸馏方法保留LLM内部几何结构,提高低精度准确性

    研究人员开发了一种名为CKA-QAD的新方法,以提高低精度大型语言模型(LLM)的准确性。传统的量化感知蒸馏(QAD)等方法侧重于匹配输出分布,但这会掩盖模型表示内部的退化。新方法使用典型相关分析(CKA)在蒸馏过程中保留LLM的内部几何结构,从而在推理和编码任务上获得更好的性能。该方法在Nemotron 3 Nano和Qwen3-4B-Thinking-2507等模型上显示出显著的改进,且仅需极少的额外训练。