PulseAugur
实时 07:39:37
English(EN) ArabDiscrim: A Decade-Long Arabic Facebook Corpus on Racism and Discrimination

新的阿拉伯语Facebook语料库详述种族主义和歧视

研究人员推出了ArabDiscrim,这是一个包含293,000条阿拉伯语Facebook帖子、跨越十年(2014-2024年)的语料库,重点关注种族主义和歧视。该数据集独特地整合了点赞和分享等互动指标以及页面元数据,以分析语言和受众互动。它还包含200个与种族主义和歧视相关的精选术语、20个不同的歧视维度以及明确的归因模式,旨在推进面向公平的阿拉伯语自然语言处理。 AI

影响 为开发更公平、更具情境意识的阿拉伯语NLP模型(尤其是在分析社会问题方面)提供了基础资源。

排序理由 该集群描述了一篇介绍数据集发布的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Wajdi Zaghouani, Shimaa Amer Ibrahim, Mabrouka Bessghaier, Houda Bouamor ·

    ArabDiscrim: A Decade-Long Arabic Facebook Corpus on Racism and Discrimination

    arXiv:2605.22081v1 Announce Type: new Abstract: We present ArabDiscrim, a decade-long lexical resource and corpus of 293K public Arabic Facebook posts (2014--2024) discussing racism and discrimination. Unlike existing Twitter-centric datasets, ArabDiscrim integrates platform-nati…

  2. arXiv cs.CL TIER_1 English(EN) · Houda Bouamor ·

    ArabDiscrim: A Decade-Long Arabic Facebook Corpus on Racism and Discrimination

    We present ArabDiscrim, a decade-long lexical resource and corpus of 293K public Arabic Facebook posts (2014--2024) discussing racism and discrimination. Unlike existing Twitter-centric datasets, ArabDiscrim integrates platform-native engagement signals, including reactions, shar…