研究人员推出了 Bn-HIB,这是一个旨在检测孟加拉语互联网表情包中的仇恨和煽动性内容的新数据集。该数据集包含 3,247 个手动标注的表情包,是首个区分孟加拉语中煽动性内容和直接仇恨言论的数据集。同时,研究人员还提出了一个多模态协同注意力融合模型 (MCFM),该模型分析表情包的视觉和文本元素以提高分类准确性。实验表明,MCFM 在 Bn-HIB 数据集上的表现优于现有的最先进模型,并且该数据集已公开提供。 AI
影响 这项研究填补了低资源语言自然语言处理领域的一个关键空白,有望改善孟加拉语在线社区的内容审核和安全性。
排序理由 该集群描述了一篇介绍针对特定自然语言处理任务的新数据集和模型的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- arXiv
- Bangla
- Bangla Hate Inflammatory Benign
- Bn-HIB
- MCFM
- Mendeley Data
- Multi-Modal Co-Attention Fusion Model
- Rakib Ullah
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →