English(EN) A Benchmark Suite of Reddit-Derived Datasets for Mental Health Detection

研究人员发布用于心理健康检测的Reddit衍生数据集

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-28 04:00

研究人员推出了一套新的基准套件，包含四个源自Reddit的数据集，旨在利用自然语言处理技术推进心理健康检测。这些数据集涵盖了识别自杀意念、一般心理障碍、双相情感障碍和多类别心理障碍分类等任务。数据集经过精心策划，具有清晰的标注指南，并通过人工判断进行验证，实现了高于0.8的较高标注者间一致性得分。以往的研究表明，Transformer和循环模型在这些任务上表现出色，F1得分在93-99%之间，这表明该数据集对于可复现的研究和模型比较具有实用价值。 AI

影响为心理健康NLP领域的可复现研究和模型比较提供了一个标准化资源。

排序理由该集群描述了一篇学术论文，该论文介绍了一个用于心理健康检测相关NLP任务的新基准套件。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Khalid Hasan, Jamil Saquer · 2026-04-28 04:00

A Benchmark Suite of Reddit-Derived Datasets for Mental Health Detection

arXiv:2604.23458v1 Announce Type: new Abstract: The growing availability of online support groups has opened up new windows to study mental health through natural language processing (NLP). However, it is hindered by a lack of high-quality, well-validated datasets. Existing studi…

报道来源 [1]

A Benchmark Suite of Reddit-Derived Datasets for Mental Health Detection

相关实体

相关话题