OpenAI 发布了 Whisper,一个在海量 680,000 小时多样化、多语言数据上训练的自动语音识别系统。如此广泛的训练使得 Whisper 能够跨越各种口音、背景噪音和技术语言进行稳健的识别,同时还支持转录和翻译成英语。该系统采用了基于 Transformer 的编码器-解码器架构,并被开源以促进语音处理领域的应用开发和进一步研究。 AI
排序理由 OpenAI 发布了一个开源语音识别模型及配套论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →