一位 Reddit 用户正在寻求帮助,解决一个 Arabic 自动语音识别 (ASR) 模型在训练过程中无法收敛的问题。该模型基于 SpeechBrain Conformer-Transformer 架构,使用了 CTC 和 KL 散度损失函数的组合。尽管早期两种损失函数都有显著下降,但很快就趋于平稳,导致验证集上的词错误率 (WER) 很高。用户尝试了调整学习率、批次大小和词汇量大小等多种方法,但均未成功,并希望从社区获得潜在的原因或解决方案。 AI
影响 此次讨论突显了训练专用 ASR 模型时面临的常见挑战,可能为其他研究人员在处理类似架构或语言时提供见解。
排序理由 用户正在就特定的机器学习模型训练问题寻求帮助,这属于研究级别的讨论。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →