PulseAugur
实时 10:58:57
English(EN) Speech-FT: Merging Pre-trained And Fine-Tuned Speech Representation Models For Cross-Task Generalization

Speech-FT 框架融合预训练和微调模型以实现更好的泛化能力

研究人员开发了 Speech-FT,一个新颖的两阶段微调框架,旨在改进语音表示模型。该方法旨在提高特定任务的性能,同时不牺牲模型跨不同任务的泛化能力。Speech-FT 首先减少微调过程中的表示漂移,然后与原始预训练模型进行插值以恢复泛化能力。实验表明,在 SUPERB 基准测试上取得了显著的改进,在各种微调场景中优于现有方法。 AI

影响 提供了一种改进语音模型性能和泛化能力的方法,可能使语音识别和说话人识别等下游应用受益。

排序理由 这是一篇详细介绍语音表示模型新框架的研究论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Speech-FT 框架融合预训练和微调模型以实现更好的泛化能力

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Tzu-Quan Lin, Wei-Ping Huang, Hao Tang, Hung-yi Lee ·

    Speech-FT: Merging Pre-trained And Fine-Tuned Speech Representation Models For Cross-Task Generalization

    arXiv:2502.12672v4 Announce Type: replace Abstract: Fine-tuning speech representation models can enhance performance on specific tasks but often compromises their cross-task generalization ability. This degradation is often caused by excessive changes in the representations, maki…