PulseAugur
实时 19:24:55
English(EN) Elderly-Contextual Data Augmentation via Speech Synthesis for Elderly ASR

研究人员通过LLM释义和语音合成增强老年人ASR

研究人员开发了一种新颖的数据增强技术,以改进老年人的自动语音识别(ASR)。该方法利用大型语言模型释义现有文本,生成老年人上下文的变体。然后,使用具有老年参考说话人的文本到语音合成将这些释义文本转换为合成语音。实验表明,与基线模型相比,词错误率显著降低,最高可提高58.2%。 AI

影响 增强了特定人群的ASR性能,可能提高了老年人对语音技术的可访问性。

排序理由 学术论文,详细介绍了一种用于ASR数据增强的新方法。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

研究人员通过LLM释义和语音合成增强老年人ASR

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Minsik Lee, Seoi Hong, Chongmin Lee, Sieun Choi, Jian Kim, Jua Han, Jihie Kim ·

    Elderly-Contextual Data Augmentation via Speech Synthesis for Elderly ASR

    arXiv:2604.24770v1 Announce Type: new Abstract: Despite recent progress in automatic speech recognition (ASR), elderly ASR (EASR) remains challenging due to limited training data and the distinct acoustic and linguistic characteristics of elderly speech. In this work, we address …