Google Research发布了WAXAL,这是一个涵盖27种非洲语言的大规模开放语音数据集,旨在弥合语音技术领域的数字鸿沟。该数据集包含约1846小时的ASR数据和超过565小时的TTS数据,是通过与非洲学术和社区组织合作收集的。同时,一个名为AfriVoices-KE的新数据集也被发布,其中包含约3000小时的五种肯尼亚语言的音频,混合了脚本化和自发性语音。这两项举措都旨在促进包容性语音技术的发展和保护语言遗产。 AI
影响 这些数据集为开发包容性语音技术和保护代表性不足地区的语言多样性奠定了基础。
排序理由 该集群描述了非洲语言大规模语音数据集的发布,这构成了AI领域的一个研究里程碑。
- Abdoulaye Diack
- Creative Commons license (CC-BY-4.0)
- Google Research
- Sub-Saharan Africa
- Tavonga Siyavora
- WAXAL
- AfriVoices-KE
- Kenyan languages
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →