English(EN) Vision Transformers for Face Recognition Need More Registers

寄存器令牌使 Vision Transformer 具有可解释性和性能提升

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-10 12:58

研究人员开发了一种使用寄存器令牌的新方法，以提高 Vision Transformer (ViTs) 在人脸识别方面的可解释性和性能。通过向初始块嵌入添加可学习的寄存器令牌，与标准的 CLS 令牌或连接块嵌入 (CPE) 方法相比，ViT-8R 模型展示了更结构化和可理解的注意力图。这种增强不仅减轻了可解释性伪影，还在 IJB-B 和 IJB-C 等大规模基准测试中取得了最先进的成果。 AI

影响增强了 ViTs 在人脸识别方面的可解释性，有望带来更值得信赖和更准确的系统。

排序理由该集群包含一篇详细介绍人脸识别新方法和模型的学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.CV TIER_1 English(EN) · Tahar Chettaoui, Guray Ozgur, Eduarda Caldeira, Naser Damer, Fadi Boutros · 2026-06-11 04:00

用于人脸识别的视觉Transformer需要更多寄存器

arXiv:2606.12036v1 Announce Type: new Abstract: Recent advances in Vision Transformers (ViTs) for face recognition (FR) have moved beyond the standard CLS-token paradigm. In this paradigm, a special classification token (CLS) is prepended to the patch embeddings and used as a rep…
arXiv cs.CV TIER_1 English(EN) · Fadi Boutros · 2026-06-10 12:58

用于人脸识别的视觉Transformer需要更多寄存器

Recent advances in Vision Transformers (ViTs) for face recognition (FR) have moved beyond the standard CLS-token paradigm. In this paradigm, a special classification token (CLS) is prepended to the patch embeddings and used as a representation of the input for downstream tasks. A…

报道来源 [2]

用于人脸识别的视觉Transformer需要更多寄存器

用于人脸识别的视觉Transformer需要更多寄存器

相关实体

相关话题