English(EN) Dealing with Annotator Disagreement in Hate Speech Classification

新方法处理仇恨言论分类中的标注者分歧

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 04:00

研究人员开发了新的方法来处理人类标注者在分类仇恨言论时的分歧。他们的工作探讨了各种聚合技术，包括多数投票和基于回归的方法，以更好地利用这些分歧中存在的信息。研究表明，丢弃带有非共识标注的样本会导致过于乐观的结果，并且对标注者分歧进行建模可以提高仇恨言论检测系统的鲁棒性和可靠性，甚至在土耳其推文上取得了新的最先进成果。 AI

影响通过更好地模拟人类主观性，提高了检测有害在线内容的AI系统的可靠性。

排序理由该集群包含一篇详细介绍特定AI任务新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Somaiyeh Dehghan, Mehmet Umut Sen, Berrin Yanikoglu · 2026-06-09 04:00

处理仇恨言论分类中的标注者分歧

arXiv:2502.08266v3 Announce Type: replace-cross Abstract: Hate speech detection is a crucial task, especially on social media where harmful content can spread quickly. Collecting social media content (tweets etc.) to train machine learning models is easy, but detecting and catego…

报道来源 [1]

处理仇恨言论分类中的标注者分歧

相关实体

相关话题