研究人员发布了 ControBench,这是一个新的基准测试,旨在通过整合社交互动图谱和丰富的文本数据来分析有争议的在线讨论。该基准测试源自 Reddit 上关于特朗普、堕胎和宗教等话题的对话,包含详细的用户和帖子信息以及互动结构。ControBench 旨在通过捕捉复杂的论证背景和用户意识形态身份,为评估模型理解政治两极分化、虚假信息和内容审核提供更现实的评估。 AI
影响 为评估 LLM 和 GNN 在复杂社交言论分析方面的能力提供了一个新数据集。
排序理由 这是一篇介绍新基准数据集的研究论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →