研究人员开发了一种使用上下文嵌入式模型(CEs)来预测普通话单音节词的语音时长和音高的方法。研究表明,CEs能够准确预测词语时长,甚至在单个词元级别上,其表现优于随机基线和排列基线。这些预测的时长足以重建音高轮廓,其结果也近似于经验轮廓,并优于排列基线。 AI
影响 这项研究通过更准确地预测韵律特征,有望改进语音合成和识别系统。
排序理由 学术论文,详细介绍了一种使用嵌入式模型预测语言特征的新方法。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →