一篇新的研究论文探讨了不同类别编码方法在高基数欺诈检测中的有效性。该研究在IEEE-CIS欺诈基准数据集上测试了七种编码器,并使用LightGBM和CatBoost学习器比较了它们的性能。实体嵌入达到了最高的AUC-ROC得分,紧随其后的是CatBoost,并且显著优于层级分组编码。然而,在AUC-PR方面,CatBoost领先,表明没有一种编码器在两项指标上都占主导地位。研究表明,实体嵌入由于能够捕获联合多列表示而具有优势。 AI
影响 这项研究通过比较不同的编码技术,为优化欺诈检测模型提供了见解,有可能提高金融应用的准确性。
排序理由 学术论文,详细介绍了一种新方法和基准测试结果。[lever_c_demoted from research: ic=1 ai=1.0]
- Catboost
- entity embeddings
- IEEE-CIS
- LightGBM
- TabNet: Attentive Interpretable Tabular Learning
- target encoding
- tier group encoding
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →