English(EN) Beyond Output Matching: Preserving Internal Geometry in NVFP4 LLM Distillatio

新的蒸馏方法保留LLM内部几何结构，提高低精度准确性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-05 04:00

研究人员开发了一种名为CKA-QAD的新方法，以提高低精度大型语言模型（LLM）的准确性。传统的量化感知蒸馏（QAD）等方法侧重于匹配输出分布，但这会掩盖模型表示内部的退化。新方法使用典型相关分析（CKA）在蒸馏过程中保留LLM的内部几何结构，从而在推理和编码任务上获得更好的性能。该方法在Nemotron 3 Nano和Qwen3-4B-Thinking-2507等模型上显示出显著的改进，且仅需极少的额外训练。 AI

影响在蒸馏过程中保留LLM内部几何结构，提高低精度模型在复杂任务上的准确性。

排序理由该集群包含一篇详细介绍LLM蒸馏新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Fangbo Tu, Junhua Zhao, Chi Liu, Xin Chen, Haifeng Wu, Jian Wan, Srinivasan Manoharan · 2026-06-05 04:00

超越输出匹配：在NVFP4 LLM蒸馏中保留内部几何结构

arXiv:2606.05682v1 Announce Type: cross Abstract: Demand for low-precision inference, including NVFP4-based approaches, has grown as large language models are increasingly deployed in latency and cost constrained production environments. Quantization-aware distillation (QAD) help…

报道来源 [1]

超越输出匹配：在NVFP4 LLM蒸馏中保留内部几何结构

相关实体

相关话题