研究人员开发了Phonikud,一个开源系统,旨在通过解决语音单元不明确问题来改进现代希伯来语的文本到语音(TTS)合成。该框架包括一个发音符号到音素的系统,该系统输出详细的国际音标(IPA)转录,一个名为ILSpeech的新语料库,其中包含带注释的希伯来语音频和文本,以及用于自动TTS评估的模型。与以前的方法相比,该系统在音素预测方面有所改进,使用Phonikud的语音单元输入的较小的TTS模型实现了与大型专有系统相当的性能。 AI
影响 通过提供更准确的语音单元表示,增强了资源匮乏语言的TTS能力。
排序理由 该集群包含一篇学术论文,详细介绍了针对特定NLP任务的新系统和数据集。[lever_c_demoted from research: ic=1 ai=1.0]
- arXiv
- Hebrew
- Hugging Face
- ILSpeech
- International Phonetic Alphabet
- Morris Alper
- Phonikud
- text-to-speech
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →