English(EN) From A to B to A: Palindromic Zero-Shot Voice Conversion with Non-Parallel Data

新的语音转换方法使用KNN处理非并行数据

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 04:00

研究人员开发了一种新颖的语音转换框架，该框架使用WavLM表示上的K近邻（KNN）检索来对齐非并行语音数据。该方法从非并行源音频和目标音频构建合成训练对，从而能够在不需要显式对齐或并行语料库的情况下进行监督学习。该框架还包含一个说话人损失，以保持一致的目标说话人身份，即使仅在英语数据上进行训练，也能在多种语言中展现出高度的自然度和说话人相似性。 AI

影响该方法可以实现更易于访问和多语言的语音转换，而无需并行数据集。

排序理由该集群包含一篇详细介绍新语音转换方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Moshe Mandel, Shlomo E. Chazan · 2026-06-09 04:00

从A到B再到A：非并行数据的回文式零样本语音转换

arXiv:2606.08843v1 Announce Type: cross Abstract: We present a voice conversion (VC) framework that utilizes K-Nearest Neighbors (KNN) retrieval over WavLM representations to align non-parallel source and target speech, constructing synthetic training pairs for supervised learnin…

报道来源 [1]

从A到B再到A：非并行数据的回文式零样本语音转换

相关话题