English(EN) NVMOS: Non-Verbal Vocalization Quality Assessment in Speech

新的NVMOS模型评估语音中的非语言发声质量

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-16 04:00

研究人员开发了NVMOS，一个旨在评估语音中非语言发声（NVs），如笑声和叹息的感知质量的新颖模型。现有的方法和像Gemini这样的通用多模态模型在评估这些NV事件方面表现出不一致性。NVMOS模型在NV-TTS系统输出和由声学专家评级的自然NV数据集上进行训练，旨在预测NV质量方面达到专家级的一致性。 AI

影响引入了一个专门用于评估非语言发声的模型，可能改进TTS系统和人机交互的分析。

排序理由该集群包含一篇详细介绍用于语音质量评估的新模型的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Jialong Mai, Jinxin Ji, Xiaofen Xing, Wencui Liu, Xiangmin Xu · 2026-06-16 04:00

NVMOS: Non-Verbal Vocalization Quality Assessment in Speech

arXiv:2606.15888v1 Announce Type: cross Abstract: Non-verbal vocalizations (NVs), such as laughter, sighs, and coughs, are important acoustic cues for emotion and intent. Existing speech quality assessment methods typically focus on overall naturalness, while non-verbal TTS evalu…

报道来源 [1]

NVMOS: Non-Verbal Vocalization Quality Assessment in Speech

相关实体

相关话题