一篇新发表在 arXiv 上的研究调查了视觉 Transformer (ViT) 架构对人脸呈现攻击检测 (PAD) 系统中人口统计学偏差的影响。该研究使用 CASIA-SURF Cross-Ethnicity Face Anti-Spoofing (CeFA) 数据集,将 ViTs 与卷积神经网络 (CNNs) 进行了比较。结果表明,与 CNN 基线相比,ViT 模型,特别是 DeiT-S 架构,在不同族裔群体中实现了更高的准确率,并显著减少了性能差异。 AI
影响 视觉 Transformer 架构可能为更公平、更鲁棒的人脸反欺骗系统提供一条途径,减少对较深肤色的偏见。
排序理由 学术论文,详细介绍了 AI 模型架构的比较研究。[lever_c_demoted from research: ic=1 ai=1.0]
- CASIA-SURF Cross-Ethnicity Face Anti-Spoofing
- convolutional neural network
- DeiT-S
- Jema David Ndibwile
- ResNet18
- Vision Transformers
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →