English(EN) Arabic ASR model struggling to converge during training [D]

Arabic ASR 模型训练停滞，用户寻求社区帮助

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-31 21:08

一位 Reddit 用户正在寻求帮助，解决一个 Arabic 自动语音识别 (ASR) 模型在训练过程中无法收敛的问题。该模型基于 SpeechBrain Conformer-Transformer 架构，使用了 CTC 和 KL 散度损失函数的组合。尽管早期两种损失函数都有显著下降，但很快就趋于平稳，导致验证集上的词错误率 (WER) 很高。用户尝试了调整学习率、批次大小和词汇量大小等多种方法，但均未成功，并希望从社区获得潜在的原因或解决方案。 AI

影响此次讨论突显了训练专用 ASR 模型时面临的常见挑战，可能为其他研究人员在处理类似架构或语言时提供见解。

排序理由用户正在就特定的机器学习模型训练问题寻求帮助，这属于研究级别的讨论。[lever_c_demoted from research: ic=1 ai=1.0]

在 r/MachineLearning 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/MachineLearning TIER_1 English(EN) · /u/Sweet-Hamster-4991 · 2026-05-31 21:08

阿拉伯语 ASR 模型在训练期间难以收敛 [D]

<div class="md"><p>i'm trying to train an ASR model using the <a href="https://github.com/speechbrain/speechbrain/blob/develop/recipes/LibriSpeech/ASR/transformer/train.py">LibriSpeech recipe from SpeechBrain</a> (without the language model) on a 100-hour dataset o…

报道来源 [1]

阿拉伯语 ASR 模型在训练期间难以收敛 [D]

相关实体

相关话题