English(EN) Diagnostic-Driven Layer-Wise Compensation for Post-Training Quantization of Encoder-Decoder ASR Models

新的FADE方法改进了面向边缘设备的ASR模型量化

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-28 04:00

研究人员开发了FADE，一种用于改进编码器-解码器自动语音识别（ASR）模型后训练量化的新颖框架。该方法通过为每个层分配自适应补偿系数来解决跨层误差累积的问题。FADE结合了来自权重几何的内在脆弱性分数和数据驱动的校准可靠性分数，以平衡局部保真度和跨层误差校正。在Whisper和Qwen3-ASR等模型上的实验证明，在3位和4位精度下，词错误率得到了一致的改进。 AI

影响通过提高量化精度，使得ASR模型能够更有效地部署在内存受限的边缘设备上。

排序理由这是一篇详细介绍模型量化新框架的研究论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Xinyu Wang, Ziyu Zhao, Yajie Luo, Yihong Wu, Liheng Ma, Jingrui Tian, Lei Ding, Xiao-Wen Chang, Peng Lu · 2026-04-28 04:00

面向Encoder-Decoder ASR模型的诊断驱动层级补偿后训练量化

arXiv:2601.02455v2 Announce Type: replace-cross Abstract: Deploying Automatic Speech Recognition (ASR) models on memory-constrained edge devices requires aggressive low-bit weight quantization. Layer-wise post-training quantization is practical and effective, but it suffers from …

报道来源 [1]

面向Encoder-Decoder ASR模型的诊断驱动层级补偿后训练量化

相关实体

相关话题