实体
Higgs Audio v3 TTS
Higgs Audio v3 TTS
PulseAugur coverage of Higgs Audio v3 TTS — every cluster mentioning Higgs Audio v3 TTS across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
HiggsAudio-Studio 提供支持 100 多种语言的离线 TTS
HiggsAudio-Studio 已发布,作为一款便携式、离线文本转语音解决方案,支持 100 多种语言,并具有零样本语音克隆功能。该工作室基于 Higgs Audio v3 TTS 构建,包含 AI 驱动的文本定向,以及播客和有声读物模式。虽然存在版本 2 的训练脚本,但用户报告了版本 3 的手动 LoRA 训练脚本存在问题。
-
Boson AI 发布 Higgs Audio v3 TTS,用于对话语音聊天
Boson AI 发布了 Higgs Audio v3 TTS,这是一款专为对话语音聊天设计的文本转语音模型。该模型支持超过 100 种语言,提供零样本语音克隆以及对情感、风格和韵律的精细控制。它使用带有交错文本和音频标记的自回归解码器,将音频编码到码本中进行处理。虽然该模型已发布供研究使用,但商业用途需要单独的许可,并严格禁止非法应用。