PulseAugur
实时 18:22:30
English(EN) AfriScience-MT: Towards Decolonizing Science in Africa through Text Translation

新语料库旨在促进非洲语言在科学领域的应用

一个名为 AfriScience-MT 的新平行语料库已被开发出来,以解决六种非洲语言(阿姆哈拉语、豪萨语、卢干达语、北部索托语、约鲁巴语和祖鲁语)在科学术语方面存在的不足。该语料库由专业翻译和科学传播者创建,涵盖 11 个科学领域,旨在实现非洲科学传播的去殖民化。对机器翻译系统和大型语言模型的基准测试显示,GPT-5.4Gemini-3.1-Flash-Lite 等闭源模型优于开源模型,其中 NLLB-1.3B 在微调后表现最佳。 AI

影响 该语料库及其基准测试有望加速低资源语言翻译的研究,并提高人工智能在非洲各科学领域的普及程度。

排序理由 该集群描述了一篇介绍平行语料库和基准测试机器翻译系统的新学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新语料库旨在促进非洲语言在科学领域的应用

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Idris Abdulmumin, Tajuddeen Gwadabe, Shamsuddeen Hassan Muhammad, David Ifeoluwa Adelani, Nomonde Khalo, Ibrahim Said Ahmad, Abiodun Modupe, Anina Mumm, Sibusiso Biyela, Michelle Rabie, Johanna Havemann, Marek Rei, Jade Abbott, Vukosi Marivate ·

    AfriScience-MT:通过文本翻译实现非洲科学的非殖民化

    arXiv:2605.29741v1 Announce Type: new Abstract: The dominance of colonial languages in African education and scientific communication limits how hundreds of millions of speakers of African languages access and produce scientific knowledge. A core obstacle is the lack of establish…

  2. arXiv cs.CL TIER_1 English(EN) · Vukosi Marivate ·

    AfriScience-MT:通过文本翻译实现非洲科学的去殖民化

    The dominance of colonial languages in African education and scientific communication limits how hundreds of millions of speakers of African languages access and produce scientific knowledge. A core obstacle is the lack of established scientific terminology in these languages. We…