Alibaba 的 Qwen 团队发布了两款新的自动语音识别 (ASR) 模型:Qwen3-ASR-1.7B-hf 和 Qwen3-ASR-0.6B-hf。这两个模型都支持 52 种语言和方言,并具备离线和流式推理能力。在 Open ASR Leaderboard 上,参数量为 1.7B 的较大模型实现了 5.59 的平均词错误率 (WER),而参数量为 0.6B 的较小模型记录的平均 WER 为 6.31。 AI
影响 这些模型提供了改进的多语言语音识别能力,支持离线和流式用例。
排序理由 发布了具有基准测试结果的新开源模型。
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →