PulseAugur
实时 15:29:41
English(EN) An Expanded Synthetic Conversation Dataset for Multi-Turn Smishing Detection

扩展数据集提升了Transformer模型在短信诈骗检测方面的能力

研究人员开发了COVA-X,一个包含10,985个合成对话的扩展数据集,用于检测多轮短信诈骗攻击,特别是那些针对老年人的攻击。这个新数据集是对最初COVA数据集的改进,解决了生成管道中的几个问题,提供了更干净、更全面的数据。扩展数据集使Longformer模型在检测短信诈骗方面优于XGBoost,取得了更高的准确率和宏F1分数,这凸显了利用Transformer模型的全部潜力需要更大的对话语料库。 AI

影响 改进的短信诈骗检测数据集和模型可以增强网络安全防御能力,以应对不断演变的诈骗策略。

排序理由 该集群包含一篇研究论文,详细介绍了新的数据集和在特定任务上改进的模型性能。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

扩展数据集提升了Transformer模型在短信诈骗检测方面的能力

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Carl Lochstampfor, Ayan Roy ·

    一个用于多轮短信诈骗检测的扩展合成对话数据集

    arXiv:2606.06879v1 Announce Type: new Abstract: Our prior work introduced COVA, a synthetically generated multi-turn conversational smishing dataset of 3,201 labeled conversations, establishing baseline detection benchmarks across eight models. While XGBoost with TF-IDF features …

  2. arXiv cs.CL TIER_1 English(EN) · Ayan Roy ·

    一个用于多轮短信诈骗检测的扩展合成对话数据集

    Our prior work introduced COVA, a synthetically generated multi-turn conversational smishing dataset of 3,201 labeled conversations, establishing baseline detection benchmarks across eight models. While XGBoost with TF-IDF features achieved the best performance, with 72.5\% accur…