研究人员开发了VibE-SVC2,一个先进的歌唱语音转换框架,旨在增强对歌唱风格的控制。该新模型提供了对音高和音色的独立控制,解决了早期版本的局限性。对于音高,它引入了能量风格转换器来管理音高-能量纠缠,以及一个零样本音高风格转换器来模仿参考音频。为了改进音色转换,特别是对于声门颤音等挑战性风格,一个次谐波校正算法对F0轮廓进行了优化。评估表明,VibE-SVC2在细粒度风格控制方面优于现有方法。 AI
排序理由 该集群包含一篇学术论文,详细介绍了歌唱语音转换的新模型和方法。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →