研究人员开发了监督语义差异法(SSD)的一个扩展,称为交互式SSD,旨在分析不同群体或条件下的语义含义如何变化。这种新方法可以识别主要的语义梯度、交互梯度和条件梯度,所有这些都可以使用现有的SSD工具进行解释。该技术被应用于加州大学伯克利分校的“衡量仇恨言论”语料库,以调查标注者的种族身份是否会影响对针对有色人种的仇恨言论的判断。研究结果表明存在显著的调节效应,一个共享梯度区分了非人化敌意和反击言论,而一个交互梯度突出了语义线索预测仇恨言论评分的细微群体特定差异。 AI
影响 引入了一种分析AI模型偏见的新颖方法,有望提高仇恨言论检测的公平性。
排序理由 该集群包含一篇详细介绍新研究方法及其应用的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →