PulseAugur
实时 05:51:58
English(EN) PASQA: Pitch-Accent-Focused Speech Quality Assessment Model Trained on Synthetic Speech with Accent Errors

新的PASQA模型针对语音质量评估中的音高-口音错误

研究人员开发了一个名为PASQA的新模型,该模型专门通过关注音高-口音错误来评估语音质量。与预测整体自然度的现有模型不同,PASQA是在一个自定义的日语数据集上训练的,该数据集包含通过语音合成生成的受控口音错误。这种方法使PASQA能够根据口音错误的严重程度准确地对语音进行排序,并更好地与人类对口音正确性的判断保持一致。 AI

影响 引入了一个用于评估语音质量的专用模型,有可能改进自动化评估系统。

排序理由 详细介绍语音质量评估新模型的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的PASQA模型针对语音质量评估中的音高-口音错误

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Reo Shimizu ·

    PASQA:基于带有口音错误的合成语音训练的音高重音感知语音质量评估模型

    Existing mean opinion score (MOS) prediction models typically predict utterance-level naturalness MOS and can be insensitive to localized pitch-accent errors. We propose Pitch-Accent-focused Speech Quality Assessment (PASQA), which explicitly targets pitch-accent correctness. To …