PulseAugur
实时 00:53:05
English(EN) Arabic ASR model struggling to converge during training [D]

Arabic ASR 模型训练停滞,用户寻求社区帮助

一位 Reddit 用户正在寻求帮助,解决一个 Arabic 自动语音识别 (ASR) 模型在训练过程中无法收敛的问题。该模型基于 SpeechBrain Conformer-Transformer 架构,使用了 CTC 和 KL 散度损失函数的组合。尽管早期两种损失函数都有显著下降,但很快就趋于平稳,导致验证集上的词错误率 (WER) 很高。用户尝试了调整学习率、批次大小和词汇量大小等多种方法,但均未成功,并希望从社区获得潜在的原因或解决方案。 AI

影响 此次讨论突显了训练专用 ASR 模型时面临的常见挑战,可能为其他研究人员在处理类似架构或语言时提供见解。

排序理由 用户正在就特定的机器学习模型训练问题寻求帮助,这属于研究级别的讨论。[lever_c_demoted from research: ic=1 ai=1.0]

在 r/MachineLearning 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. r/MachineLearning TIER_1 English(EN) · /u/Sweet-Hamster-4991 ·

    阿拉伯语 ASR 模型在训练期间难以收敛 [D]

    <!-- SC_OFF --><div class="md"><p>i'm trying to train an ASR model using the <a href="https://github.com/speechbrain/speechbrain/blob/develop/recipes/LibriSpeech/ASR/transformer/train.py">LibriSpeech recipe from SpeechBrain</a> (without the language model) on a 100-hour dataset o…