实体 Singing Voice Synthesis

Singing Voice Synthesis

PulseAugur coverage of Singing Voice Synthesis — every cluster mentioning Singing Voice Synthesis across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 2

发布 · 30天

90 天内 0

论文 · 30天

90 天内 2

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 2 条

RESEARCH · CL_74415 · Jun 5 · 07:59

新模型统一语音和歌声生成

研究人员开发了新的统一模型，用于生成人类语音音频，能够同时生成语音和歌声。UniVoice 使用条件流匹配方法，分离内容、旋律和音色，从而能够独立控制语音韵律和歌唱旋律。UniSinger 基于多模态扩散 Transformer 构建，统一了说话人克隆歌曲生成与带伴奏的歌声转换。这两个模型在各自的任务上都展现了最先进的性能，为音频生成和音乐制作带来了新的可能性。
TOOL · CL_26974 · May 6 · 08:03

VocalParse模型利用LALM推进歌声转录

研究人员开发了VocalParse，一种利用大型音频语言模型（LALM）进行歌声转录的新模型。该模型通过交错提示公式，联合建模歌词、旋律和音符文本对齐，解决了当前系统的局限性。VocalParse还采用思维链策略，首先解码歌词，有助于保持结构完整性并提高转录准确性，在各种歌声数据集上取得了最先进的成果。

新模型统一语音和歌声生成

VocalParse模型利用LALM推进歌声转录