研究人员推出ToxiREX,一个旨在捕捉在线对话中隐式和上下文相关毒性的多语言新数据集。该数据集包含Reddit评论线程,使用结构化的毒性推理模式进行标注,并包含六种语言的内容。ToxiREX旨在通过考虑对话上下文来提供对毒性更细致的理解,这是以前的数据集中不存在的特征。初步实验表明,虽然语言模型在此任务上的表现优于随机猜测,但仍需显著改进。 AI
影响 该数据集可以通过更好地检测细微和上下文相关的有毒语言来改善LLM的安全性。
排序理由 该集群描述了一个新的学术数据集和相关的研究论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →