PulseAugur
实时 10:50:58
实体 Flow-matching TTS

Flow-matching TTS

PulseAugur coverage of Flow-matching TTS — every cluster mentioning Flow-matching TTS across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_99946 ·

    FlowEdit 实现 TTS 模型终身发音适应

    研究人员开发了 FlowEdit,一个新颖的框架,旨在使冻结的流匹配文本到语音(TTS)系统能够进行终身发音纠正。FlowEdit 不会重新训练整个模型,而是在文本嵌入空间中将发音调整学习为潜在编辑。这些纠正存储在现代 Hopfield 网络中,充当联想记忆,并在推理过程中通过软注意力检索。这种方法显著减少了专有名词的发音错误,在多语言基准测试中语音错误率(Phoneme Error Rate)相对降低了 92.7%,同时保持了整体语音质量。