研究人员开发了一个名为PASQA的新模型,该模型专门通过关注音高-口音错误来评估语音质量。与预测整体自然度的现有模型不同,PASQA是在一个自定义的日语数据集上训练的,该数据集包含通过语音合成生成的受控口音错误。这种方法使PASQA能够根据口音错误的严重程度准确地对语音进行排序,并更好地与人类对口音正确性的判断保持一致。 AI
影响 引入了一个用于评估语音质量的专用模型,有可能改进自动化评估系统。
排序理由 详细介绍语音质量评估新模型的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →