Hugging Face 开发了一个基准测试,用于评估自动语音识别 (ASR) 系统在处理代码切换语音(即个人在句子中途切换语言)方面的能力。这对于服务双语客户群体的语音助手至关重要。该基准测试涵盖了西班牙语-英语和法语-英语等语言对,并使用了 HR 和 IT 服务管理场景。表现最佳的模型包括 ElevenLabs Scribe V2、Gemini 3 Flash 和 Assembly AI Universal 3-Pro,结果使用词错误率 (WER)、语义词错误率 (SWER) 和答案错误率 (AER) 进行报告。 AI
影响 为评估多语言企业环境中的语音助手设定了新标准,有望推动全球客户服务 ASR 的改进。
排序理由 该集群描述了一个用于评估代码切换语音 ASR 系统的新的基准测试和数据集,以及几个模型的性能结果。
- Assembly AI Universal 3-Pro
- ElevenLabs Multilingual V2
- ElevenLabs Scribe V2
- Gemini 3 Flash
- GPT-5
- Hugging Face
- OpenAI
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →