研究人员开发了一种新颖的数据增强技术,以改进老年人的自动语音识别(ASR)。该方法利用大型语言模型释义现有文本,生成老年人上下文的变体。然后,使用具有老年参考说话人的文本到语音合成将这些释义文本转换为合成语音。实验表明,与基线模型相比,词错误率显著降低,最高可提高58.2%。 AI
影响 增强了特定人群的ASR性能,可能提高了老年人对语音技术的可访问性。
排序理由 学术论文,详细介绍了一种用于ASR数据增强的新方法。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →