PulseAugur
实时 08:36:16
实体 Scena

Scena

PulseAugur coverage of Scena — every cluster mentioning Scena across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_97814 ·

    新型AI模型ScenA可根据文本生成逼真的多说话人音频场景

    研究人员开发了ScenA,一种从自然语言描述和语音参考生成多说话人音频场景的新颖方法。与依赖结构化监督的先前系统不同,ScenA利用了一个在多样化、真实音频数据上预训练的文本到音频流匹配基础模型。这种方法允许包含逼真的环境声音、房间声学和重叠对话。一个关键的挑战是“参考捷径”,即模型可能仅通过依赖声学相似性来绕过文本提示;ScenA通过采用高噪声偏差的训练分布来缓解此问题。在CoVoMix2-Dialogue基准上的评估表明,Scen…