PulseAugur
实时 08:58:09
实体 A Geometric Perspective on Composable Emotion Steering in Text-to-Speech Models

A Geometric Perspective on Composable Emotion Steering in Text-to-Speech Models

PulseAugur coverage of A Geometric Perspective on Composable Emotion Steering in Text-to-Speech Models — every cluster mentioning A Geometric Perspective on Composable Emotion Steering in Text-to-Speech Models across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_121158 ·

    新研究探讨语音合成模型中情感引导的几何特性

    研究人员提出了一项新研究,探讨了文本到语音(TTS)系统中情感控制的几何特性。该研究将语音语言模型(SLM)和条件流匹配(CFM)模块作为语音合成中引导混合情感的载体。研究结果表明,SLM为情感提供了一个独特、低维度的子空间,具有良好的说话人-情感解耦性,而CFM模块由于说话人和情感表示的纠缠,跨说话人性能较弱。联合引导可以增强情感强度,但可能会降低比例控制和语音质量。