English(EN) Speech Synthesis, Recognition, and More With SpeechT5

Hugging Face 发布 SpeechT5，支持高级语音合成与识别

作者 PulseAugur 编辑部 · [1 个来源] · 2023-02-08 00:00

Hugging Face 发布了 SpeechT5，这是一款可用于多种语音任务的多功能模型。它可以执行语音识别、语音合成和说话人识别。该模型基于 T5 架构构建，在这些不同的应用中均表现出色。 AI

排序理由知名人工智能社区平台发布新模型，适用于研发。

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Hugging Face Blog TIER_1 English(EN) · 2023-02-08 00:00

Speech Synthesis, Recognition, and More With SpeechT5