PulseAugur
实时 10:17:21
English(EN) CrossAccent-TTS: Cross-Lingual Accent-Intensity Controllable Text-to-Speech via Disentangled Speaker and Accent Representations

新的TTS框架提供对跨语言口音的细粒度控制

研究人员开发了CrossAccent-TTS,一个旨在改进跨语言文本到语音(TTS)能力的新型框架,特别针对资源匮乏的印度语言。该系统引入了一个口音强度控制器(AIC),允许在语音合成过程中对口音特征及其强度进行显式控制。实验表明,CrossAccent-TTS在保持说话人身份和自然度的同时有效控制口音强度,在口音相似性和可控性方面优于现有方法。 AI

影响 增强了跨语言TTS的控制力和自然度,可能提高了资源匮乏语言的可访问性。

排序理由 详细介绍一种新的文本到语音合成方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的TTS框架提供对跨语言口音的细粒度控制

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Pankaj Wasnik ·

    CrossAccent-TTS: Cross-Lingual Accent-Intensity Controllable Text-to-Speech via Disentangled Speaker and Accent Representations

    Accent conversion and controllability remain fundamental challenges in cross-lingual text-to-speech (TTS), particularly for low-resource and phonetically diverse Indic languages. While recent large language model (LLM)-based TTS systems exhibit strong cross-lingual generalization…