实体 AudioVAE

AudioVAE

PulseAugur coverage of AudioVAE — every cluster mentioning AudioVAE across labs, papers, and developer communities, ranked by signal.

总计 · 30天

0

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

0

90 天内 1

层级分布 · 90 天

主题

最近 · 第 1/1 页 · 共 1 条

RESEARCH · CL_77122 · Jun 5 · 00:00

新的20亿参数TTS模型dots.tts达到SOTA

研究人员推出dots.tts，一个拥有20亿参数、在连续潜在空间中运行的文本到语音模型。该模型包含多项创新，包括用于结构化语音表示的AudioVAE、用于提高一致性的全历史条件以及用于增强鲁棒性的自纠正后训练。Dots.tts在Seed-TTS-Eval等基准测试中取得了最先进的成果，并通过MeanFlow蒸馏实现了高效、低延迟的生成。