研究人员分析了自动语音识别 (ASR) 系统的微调策略,特别关注涉及儿童语音的低资源场景。该研究调查了各种声学特征及其对不同声学模型的影响,发现音高特征显著提高了构音障碍语音的识别性能。通过系统地检查带有因子化时延神经网络 (F-TDNN) 模型的 TORGO 数据库,该团队在孤立词识别方面取得了 4.65% 的相对改进,在句子识别方面取得了 4.63% 的相对改进。 AI
影响 这项研究可能带来更准确的儿童语音识别系统,特别是针对有语言障碍的儿童。
排序理由 该集群包含一篇学术论文,详细介绍了语音识别的新分析和方法。 [lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →