研究人员推出了ArabDiscrim,这是一个包含293,000条阿拉伯语Facebook帖子、跨越十年(2014-2024年)的语料库,重点关注种族主义和歧视。该数据集独特地整合了点赞和分享等互动指标以及页面元数据,以分析语言和受众互动。它还包含200个与种族主义和歧视相关的精选术语、20个不同的歧视维度以及明确的归因模式,旨在推进面向公平的阿拉伯语自然语言处理。 AI
影响 为开发更公平、更具情境意识的阿拉伯语NLP模型(尤其是在分析社会问题方面)提供了基础资源。
排序理由 该集群描述了一篇介绍数据集发布的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →