PulseAugur
实时 20:45:13
English(EN) WAXAL: A large-scale open resource for African language speech technology

Google发布27种非洲语言的WAXAL数据集,AfriVoices-KE新增肯尼亚语言 · 跟踪2个来源

Google Research发布了WAXAL,这是一个涵盖27种非洲语言的大规模开放语音数据集,旨在弥合语音技术领域的数字鸿沟。该数据集包含约1846小时的ASR数据和超过565小时的TTS数据,是通过与非洲学术和社区组织合作收集的。同时,一个名为AfriVoices-KE的新数据集也被发布,其中包含约3000小时的五种肯尼亚语言的音频,混合了脚本化和自发性语音。这两项举措都旨在促进包容性语音技术的发展和保护语言遗产。 AI

影响 这些数据集为开发包容性语音技术和保护代表性不足地区的语言多样性奠定了基础。

排序理由 该集群描述了非洲语言大规模语音数据集的发布,这构成了AI领域的一个研究里程碑。

在 Google AI / Research 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

Google发布27种非洲语言的WAXAL数据集,AfriVoices-KE新增肯尼亚语言 · 跟踪2个来源

报道来源 [2]

  1. Google AI / Research TIER_1 English(EN) ·

    WAXAL: A large-scale open resource for African language speech technology

    Natural Language Processing

  2. arXiv cs.CL TIER_1 English(EN) · Lilian Wanzare, Cynthia Amol, Ezekiel Maina, Nelson Odhiambo, Hope Kerubo, Leila Misula, Vivian Oloo, Rennish Mboya, Edwin Onkoba, Edward Ombui, Joseph Muguro, Ciira wa Maina, Andrew Kipkebut, Alfred Omondi Otom, Ian Ndung'u Kang'ethe, Angela Wambui Kany… ·

    AfriVoices-KE: A Multilingual Speech Dataset for Kenyan Languages

    arXiv:2604.08448v2 Announce Type: replace Abstract: AfriVoices-KE is a large-scale multilingual speech dataset comprising approximately 3,000 hours of audio across five Kenyan languages: Dholuo, Kikuyu, Kalenjin, Maasai, and Somali. The dataset includes 750 hours of scripted spee…