新数据集训练AI以应对在线仇恨言论和虚假信息

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-18 15:32

研究人员推出了CATCH-ME，这是一个新颖的数据集，旨在训练自然语言处理模型生成有效的反驳言论，以应对在线仇恨言论和虚假信息。该数据集是同类数据集中首个解决跨多轮和多种语言的这两种威胁交叉问题的。它包含了专家策划的五种语言的对话，针对针对七个边缘化群体的仇恨言论，并以经过验证的外部知识为基础，以确保事实准确性。该数据集特别适用于检索增强生成（RAG）系统，提供了文档和块级别的注释，以增强生成反驳言论的说服力和事实依据。 AI

影响该数据集可以通过实现更细致、更基于事实的响应，显著提高AI应对在线仇恨言论和虚假信息的能力。

排序理由该集群包含一篇详细介绍用于NLP的新数据集的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Marco Guerini · 2026-06-18 15:32

CATCH-ME if you RAG：一个包含上下文标注的多轮反驳仇恨言论和虚假信息交流的数据集

Online hate speech and misinformation frequently overlap, yet NLP research has mainly treated them in isolation. While LLMs represent a scalable solution for assisting humans in the generation of counterspeech for both threats, zero-shot models frequently generate repetitive and …

报道来源 [1]

CATCH-ME if you RAG：一个包含上下文标注的多轮反驳仇恨言论和虚假信息交流的数据集

相关实体

相关话题