PulseAugur
实时 15:30:19
English(EN) Semantic Gradients Interactions in SSD: A Case Study in Racial Identity and Hate Speech

新方法分析标注者身份如何影响仇恨言论判断

研究人员开发了监督语义差异法(SSD)的一个扩展,称为交互式SSD,旨在分析不同群体或条件下的语义含义如何变化。这种新方法可以识别主要的语义梯度、交互梯度和条件梯度,所有这些都可以使用现有的SSD工具进行解释。该技术被应用于加州大学伯克利分校的“衡量仇恨言论”语料库,以调查标注者的种族身份是否会影响对针对有色人种的仇恨言论的判断。研究结果表明存在显著的调节效应,一个共享梯度区分了非人化敌意和反击言论,而一个交互梯度突出了语义线索预测仇恨言论评分的细微群体特定差异。 AI

影响 引入了一种分析AI模型偏见的新颖方法,有望提高仇恨言论检测的公平性。

排序理由 该集群包含一篇详细介绍新研究方法及其应用的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新方法分析标注者身份如何影响仇恨言论判断

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Felix Ostrowicki, Hubert Plisiecki ·

    SSD中的语义梯度交互:种族认同与仇恨言论的案例研究

    arXiv:2605.27322v1 Announce Type: new Abstract: We introduce interaction SSD, an extension of Supervised Semantic Differential that models how semantic meaning varies across moderators such as groups, traits, or conditions making this variation testable and interpretable. The met…

  2. arXiv cs.CL TIER_1 English(EN) · Hubert Plisiecki ·

    SSD中的语义梯度交互:种族认同与仇恨言论的案例研究

    We introduce interaction SSD, an extension of Supervised Semantic Differential that models how semantic meaning varies across moderators such as groups, traits, or conditions making this variation testable and interpretable. The method estimates a main semantic gradient, an inter…