Hugging Face 开发了一个新的基准和数据集,用于评估自动语音识别 (ASR) 系统如何处理代码切换语音,这是双语者常见的做法。该基准侧重于与企业客户群相关的四种语言组合:西班牙语-英语、法语-英语、加拿大法语-英语和德语-英语。研究报告了七个 ASR 系统的结果,其中 ElevenLabs Scribe V2、Gemini 3 Flash 和 Assembly AI Universal 3-Pro 在各种指标上表现最佳。 AI
影响 该基准将有助于提高语音助手在双语客户群中的性能,从而改善用户体验和运营效率。
排序理由 该集群描述了一个用于评估代码切换语音 ASR 系统的新的基准和数据集,包括方法和结果。[lever_c_demoted from research: ic=1 ai=1.0]
- Assembly AI Universal 3-Pro
- ElevenLabs Multilingual V2
- ElevenLabs Scribe V2
- Gemini 3 Flash
- GPT-5
- Hugging Face
- OpenAI
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →