English(EN) CrossAccent-TTS: Cross-Lingual Accent-Intensity Controllable Text-to-Speech via Disentangled Speaker and Accent Representations

新的TTS框架提供对跨语言口音的细粒度控制

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-24 05:02

研究人员开发了CrossAccent-TTS，一个旨在改进跨语言文本到语音（TTS）能力的新型框架，特别针对资源匮乏的印度语言。该系统引入了一个口音强度控制器（AIC），允许在语音合成过程中对口音特征及其强度进行显式控制。实验表明，CrossAccent-TTS在保持说话人身份和自然度的同时有效控制口音强度，在口音相似性和可控性方面优于现有方法。 AI

影响增强了跨语言TTS的控制力和自然度，可能提高了资源匮乏语言的可访问性。

排序理由详细介绍一种新的文本到语音合成方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Pankaj Wasnik · 2026-06-24 05:02

CrossAccent-TTS: Cross-Lingual Accent-Intensity Controllable Text-to-Speech via Disentangled Speaker and Accent Representations

Accent conversion and controllability remain fundamental challenges in cross-lingual text-to-speech (TTS), particularly for low-resource and phonetically diverse Indic languages. While recent large language model (LLM)-based TTS systems exhibit strong cross-lingual generalization…

报道来源 [1]

CrossAccent-TTS: Cross-Lingual Accent-Intensity Controllable Text-to-Speech via Disentangled Speaker and Accent Representations

相关话题