PulseAugur
实时 03:27:30
Deutsch(DE) Qwen/Qwen3-ASR-0.6B-hf ist ein Automatic-Speech-Recognition-Modell. Die Card nennt Sprachidentifikation und ASR fuer 52 Sprachen und Dialekte sowie Offline-/Str

Alibaba 的 Qwen 发布两款新的多语言 ASR 模型

AlibabaQwen 团队发布了两款新的自动语音识别 (ASR) 模型:Qwen3-ASR-1.7B-hf 和 Qwen3-ASR-0.6B-hf。这两个模型都支持 52 种语言和方言,并具备离线和流式推理能力。在 Open ASR Leaderboard 上,参数量为 1.7B 的较大模型实现了 5.59 的平均词错误率 (WER),而参数量为 0.6B 的较小模型记录的平均 WER 为 6.31。 AI

影响 这些模型提供了改进的多语言语音识别能力,支持离线和流式用例。

排序理由 发布了具有基准测试结果的新开源模型。

在 Mastodon — mastodon.social 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

Alibaba 的 Qwen 发布两款新的多语言 ASR 模型

报道来源 [2]

  1. Mastodon — mastodon.social TIER_1 Deutsch(DE) · aisyndicate ·

    Qwen/Qwen3-ASR-1.7B-hf 是一个自动语音识别模型。该卡列出了52种语言和方言,以及离线和流式推理。README f

    Qwen/Qwen3-ASR-1.7B-hf ist ein Automatic-Speech-Recognition-Modell. Die Card nennt 52 Sprachen und Dialekte sowie Offline- und Streaming-Inferenz. Die README führt eine Mean WER von 5.59 auf dem Open ASR Leaderboard aus. https:// huggingface.co/Qwen/Qwen3-ASR- 1.7B-hf # KI # AI #…

  2. Mastodon — mastodon.social TIER_1 Deutsch(DE) · aisyndicate ·

    Qwen/Qwen3-ASR-0.6B-hf 是一个自动语音识别模型。该卡片提到了对 52 种语言和方言的语言识别和 ASR,以及离线/str

    Qwen/Qwen3-ASR-0.6B-hf ist ein Automatic-Speech-Recognition-Modell. Die Card nennt Sprachidentifikation und ASR fuer 52 Sprachen und Dialekte sowie Offline-/Streaming-Inferenz. In den Benchmarks steht ein Mean WER von 6.31. https:// huggingface.co/Qwen/Qwen3-ASR- 0.6B-hf # KI # A…