English(EN) Introducing Whisper

OpenAI 发布 Whisper，一个开源的多语言语音识别系统

作者 PulseAugur 编辑部 · [1 个来源] · 2022-09-21 07:00

OpenAI 发布了 Whisper，一个在海量 680,000 小时多样化、多语言数据上训练的自动语音识别系统。如此广泛的训练使得 Whisper 能够跨越各种口音、背景噪音和技术语言进行稳健的识别，同时还支持转录和翻译成英语。该系统采用了基于 Transformer 的编码器-解码器架构，并被开源以促进语音处理领域的应用开发和进一步研究。 AI

排序理由 OpenAI 发布了一个开源语音识别模型及配套论文。

在 OpenAI News 阅读 →

模型发布
论文
产品

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

OpenAI News TIER_1 English(EN) · 2022-09-21 07:00

Introducing Whisper

报道来源 [1]

Introducing Whisper

相关话题