English(EN) UniRefiner: Teaching Pre-trained ViTs to Self-Dispose Dross via Contrastive Register

UniRefiner 框架教会 ViT 丢弃虚假 token

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-19 10:00

研究人员开发了 UniRefiner，一个旨在提高 Vision Transformer (ViT) 模型空间精度的框架。该方法教会预训练的 ViT 识别和丢弃可能降低空间敏感任务性能的无关或虚假 token。通过使用对比寄存器和双重目标，UniRefiner 能够以最小的微调来优化各种 ViT，从而在语义分割等任务中取得显著改进。 AI

影响增强了基础视觉模型的空间推理能力，可能拓宽其在密集预测任务中的应用范围。

排序理由该集群包含一篇学术论文，详细介绍了一种改进现有 AI 模型的新方法。 [lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Tong Zhang · 2026-05-19 10:00

UniRefiner：通过对比注册器教会预训练ViT自我处理杂质

Representation learning with Vision Transformers (ViTs) has advanced rapidly, yet the utility of large-scale models in spatially sensitive tasks is hindered by spurious tokens. Prior efforts to mitigate this have been limited, often defining these artifacts narrowly, for example,…

报道来源 [1]

UniRefiner：通过对比注册器教会预训练ViT自我处理杂质

相关实体

相关话题