PulseAugur
实时 13:29:22
English(EN) NVMOS: Non-Verbal Vocalization Quality Assessment in Speech

新的NVMOS模型评估语音中的非语言发声质量

研究人员开发了NVMOS,一个旨在评估语音中非语言发声(NVs),如笑声和叹息的感知质量的新颖模型。现有的方法和像Gemini这样的通用多模态模型在评估这些NV事件方面表现出不一致性。NVMOS模型在NV-TTS系统输出和由声学专家评级的自然NV数据集上进行训练,旨在预测NV质量方面达到专家级的一致性。 AI

影响 引入了一个专门用于评估非语言发声的模型,可能改进TTS系统和人机交互的分析。

排序理由 该集群包含一篇详细介绍用于语音质量评估的新模型的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Jialong Mai, Jinxin Ji, Xiaofen Xing, Wencui Liu, Xiangmin Xu ·

    NVMOS: Non-Verbal Vocalization Quality Assessment in Speech

    arXiv:2606.15888v1 Announce Type: cross Abstract: Non-verbal vocalizations (NVs), such as laughter, sighs, and coughs, are important acoustic cues for emotion and intent. Existing speech quality assessment methods typically focus on overall naturalness, while non-verbal TTS evalu…