PulseAugur
实时 03:52:09
实体 Cartesia Sonic-3

Cartesia Sonic-3

PulseAugur coverage of Cartesia Sonic-3 — every cluster mentioning Cartesia Sonic-3 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
最近 · 第 1/1 页 · 共 2 条
  1. RESEARCH · CL_08270 ·

    新基准评估六维度的印度语言TTS口音保真度

    研究人员推出PSP,一个旨在评估印度语言文本到语音(TTS)系统口音准确性的新基准。与关注清晰度和自然度的现有指标不同,PSP通过将其分解为六个不同的维度来专门衡量口音,包括卷舌音合并和韵律特征发散。对ElevenLabs v3和Sarvam Bulbul等系统的初步测试显示,在词错误率方面表现最佳的系统不一定在口音保真度方面表现出色,这凸显了对更细致评估方法的需求。

  2. RESEARCH · CL_08273 ·

    Praxy Voice 以最小的干预实现了商业级印度语 TTS

    研究人员开发了 Praxy Voice,一种使用预训练的非印度语模型来改进印度语文本到语音 (TTS) 的方法。该方法结合了用于脚本罗马化的 Brahmic Unified Phoneme Space (BUPS)、用于文本令牌预测器的 LoRA 适配器以及语音提示恢复技术。该方法在无需新的声码器训练或商业 TTS 数据的情况下,实现了泰卢固语、泰米尔语和印地语的商业级音频输出。