研究人员开发了FMSD-TTS,一个新颖的少样本文本到语音系统,旨在为资源匮乏的藏语及其三个主要方言:卫藏语、安多语和康语生成语音。该系统利用说话人-方言融合模块和方言专用动态路由网络来准确捕捉方言差异,同时保持说话人身份。评估表明,FMSD-TTS在方言表现力和说话人相似性方面优于现有方法,并且合成语音在语音到语音方言转换任务上得到了验证。 AI
影响 能够为资源匮乏的语言创建合成语音,可能有助于方言保护和可访问性。
排序理由 这是一篇描述一种针对资源匮乏语言的新文本到语音系统的研究论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →