English(EN) Speech-FT: Merging Pre-trained And Fine-Tuned Speech Representation Models For Cross-Task Generalization

Speech-FT 框架融合预训练和微调模型以实现更好的泛化能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-28 04:00

研究人员开发了 Speech-FT，一个新颖的两阶段微调框架，旨在改进语音表示模型。该方法旨在提高特定任务的性能，同时不牺牲模型跨不同任务的泛化能力。Speech-FT 首先减少微调过程中的表示漂移，然后与原始预训练模型进行插值以恢复泛化能力。实验表明，在 SUPERB 基准测试上取得了显著的改进，在各种微调场景中优于现有方法。 AI

影响提供了一种改进语音模型性能和泛化能力的方法，可能使语音识别和说话人识别等下游应用受益。

排序理由这是一篇详细介绍语音表示模型新框架的研究论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Tzu-Quan Lin, Wei-Ping Huang, Hao Tang, Hung-yi Lee · 2026-04-28 04:00

Speech-FT：融合预训练和微调语音表示模型以实现跨任务泛化

arXiv:2502.12672v4 Announce Type: replace Abstract: Fine-tuning speech representation models can enhance performance on specific tasks but often compromises their cross-task generalization ability. This degradation is often caused by excessive changes in the representations, maki…

报道来源 [1]

Speech-FT：融合预训练和微调语音表示模型以实现跨任务泛化

相关实体

相关话题