PulseAugur
实时 10:04:38
English(EN) A Benchmark Suite of Reddit-Derived Datasets for Mental Health Detection

研究人员发布用于心理健康检测的Reddit衍生数据集

研究人员推出了一套新的基准套件,包含四个源自Reddit的数据集,旨在利用自然语言处理技术推进心理健康检测。这些数据集涵盖了识别自杀意念、一般心理障碍、双相情感障碍和多类别心理障碍分类等任务。数据集经过精心策划,具有清晰的标注指南,并通过人工判断进行验证,实现了高于0.8的较高标注者间一致性得分。以往的研究表明,Transformer和循环模型在这些任务上表现出色,F1得分在93-99%之间,这表明该数据集对于可复现的研究和模型比较具有实用价值。 AI

影响 为心理健康NLP领域的可复现研究和模型比较提供了一个标准化资源。

排序理由 该集群描述了一篇学术论文,该论文介绍了一个用于心理健康检测相关NLP任务的新基准套件。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

研究人员发布用于心理健康检测的Reddit衍生数据集

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Khalid Hasan, Jamil Saquer ·

    A Benchmark Suite of Reddit-Derived Datasets for Mental Health Detection

    arXiv:2604.23458v1 Announce Type: new Abstract: The growing availability of online support groups has opened up new windows to study mental health through natural language processing (NLP). However, it is hindered by a lack of high-quality, well-validated datasets. Existing studi…