English(EN) An Expanded Synthetic Conversation Dataset for Multi-Turn Smishing Detection

扩展数据集提升了Transformer模型在短信诈骗检测方面的能力

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-05 03:46

研究人员开发了COVA-X，一个包含10,985个合成对话的扩展数据集，用于检测多轮短信诈骗攻击，特别是那些针对老年人的攻击。这个新数据集是对最初COVA数据集的改进，解决了生成管道中的几个问题，提供了更干净、更全面的数据。扩展数据集使Longformer模型在检测短信诈骗方面优于XGBoost，取得了更高的准确率和宏F1分数，这凸显了利用Transformer模型的全部潜力需要更大的对话语料库。 AI

影响改进的短信诈骗检测数据集和模型可以增强网络安全防御能力，以应对不断演变的诈骗策略。

排序理由该集群包含一篇研究论文，详细介绍了新的数据集和在特定任务上改进的模型性能。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.CL TIER_1 English(EN) · Carl Lochstampfor, Ayan Roy · 2026-06-08 04:00

一个用于多轮短信诈骗检测的扩展合成对话数据集

arXiv:2606.06879v1 Announce Type: new Abstract: Our prior work introduced COVA, a synthetically generated multi-turn conversational smishing dataset of 3,201 labeled conversations, establishing baseline detection benchmarks across eight models. While XGBoost with TF-IDF features …
arXiv cs.CL TIER_1 English(EN) · Ayan Roy · 2026-06-05 03:46

一个用于多轮短信诈骗检测的扩展合成对话数据集

Our prior work introduced COVA, a synthetically generated multi-turn conversational smishing dataset of 3,201 labeled conversations, establishing baseline detection benchmarks across eight models. While XGBoost with TF-IDF features achieved the best performance, with 72.5\% accur…

报道来源 [2]

一个用于多轮短信诈骗检测的扩展合成对话数据集

一个用于多轮短信诈骗检测的扩展合成对话数据集

相关实体

相关话题