English(EN) Interpretable vs Learned Encoders for High-Cardinality Fraud Detection

实体嵌入在高基数欺诈检测基准测试中领先

作者 PulseAugur 编辑部 · [2 个来源] · 2026-07-01 05:51

一篇新的研究论文探讨了不同类别编码方法在高基数欺诈检测中的有效性。该研究在IEEE-CIS欺诈基准数据集上测试了七种编码器，并使用LightGBM和CatBoost学习器比较了它们的性能。实体嵌入达到了最高的AUC-ROC得分，紧随其后的是CatBoost，并且显著优于层级分组编码。然而，在AUC-PR方面，CatBoost领先，表明没有一种编码器在两项指标上都占主导地位。研究表明，实体嵌入由于能够捕获联合多列表示而具有优势。 AI

影响这项研究通过比较不同的编码技术，为优化欺诈检测模型提供了见解，有可能提高金融应用的准确性。

排序理由学术论文，详细介绍了一种新方法和基准测试结果。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.LG TIER_1 English(EN) · Xiao Han, Jingjing Liu, Moxuan Zheng, Zhen Zhang, Chenyu Wu · 2026-07-02 04:00

Interpretable vs Learned Encoders for High-Cardinality Fraud Detection

arXiv:2607.00477v1 Announce Type: new Abstract: A total of seven categorical encoding methods were tested on the IEEE-CIS fraud benchmark dataset (590,540 records, 3.5% positives, 8 high-cardinality columns). The encoders were evaluated using a stratified 5-fold cross-validation …
arXiv cs.LG TIER_1 English(EN) · Chenyu Wu · 2026-07-01 05:51

可解释编码器与学习编码器在处理高基数欺诈检测中的对比

A total of seven categorical encoding methods were tested on the IEEE-CIS fraud benchmark dataset (590,540 records, 3.5% positives, 8 high-cardinality columns). The encoders were evaluated using a stratified 5-fold cross-validation (CV) with three repetitions. Five of the encoder…

报道来源 [2]

Interpretable vs Learned Encoders for High-Cardinality Fraud Detection

可解释编码器与学习编码器在处理高基数欺诈检测中的对比

相关实体

相关话题