实体
Singing Voice Synthesis
Singing Voice Synthesis
PulseAugur coverage of Singing Voice Synthesis — every cluster mentioning Singing Voice Synthesis across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
1 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新模型统一语音和歌声生成
研究人员开发了新的统一模型,用于生成人类语音音频,能够同时生成语音和歌声。UniVoice 使用条件流匹配方法,分离内容、旋律和音色,从而能够独立控制语音韵律和歌唱旋律。UniSinger 基于多模态扩散 Transformer 构建,统一了说话人克隆歌曲生成与带伴奏的歌声转换。这两个模型在各自的任务上都展现了最先进的性能,为音频生成和音乐制作带来了新的可能性。
-
VocalParse模型利用LALM推进歌声转录
研究人员开发了VocalParse,一种利用大型音频语言模型(LALM)进行歌声转录的新模型。该模型通过交错提示公式,联合建模歌词、旋律和音符文本对齐,解决了当前系统的局限性。VocalParse还采用思维链策略,首先解码歌词,有助于保持结构完整性并提高转录准确性,在各种歌声数据集上取得了最先进的成果。