PulseAugur
实时 17:11:29

研究人员为图像失真鲁棒学习提炼 Vision Transformers

研究人员开发了一个新的知识蒸馏框架,以提高视觉模型对图像失真的鲁棒性。该方法采用一种不对称方法,其中教师模型处理干净的图像,而学生模型则从同一图像的失真版本中学习。这种涉及对全局嵌入、补丁级特征和注意力图进行对齐的技术,使学生模型即使在没有直接访问干净数据的情况下也能近似干净图像的表示。与现有方法相比,该方法在各种失真下的图像分类任务上表现出优越的性能。 AI

影响 增强了视觉模型在失真图像上的性能,可能改进自动驾驶和医学成像等实际应用。

排序理由 关于改进视觉模型鲁棒性新方法的学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

研究人员为图像失真鲁棒学习提炼 Vision Transformers

报道来源 [2]

  1. arXiv cs.CV TIER_1 English(EN) · Konstantinos Alexis, Giorgos Giannopoulos, Dimitrios Gunopulos ·

    Distilling Vision Transformers for Distortion-Robust Representation Learning

    arXiv:2604.22529v1 Announce Type: new Abstract: Self-supervised learning has achieved remarkable success in learning visual representations from clean data, yet remains challenging when clean observations are sparse or not available at all. In this paper, we demonstrate that pret…

  2. arXiv cs.CV TIER_1 English(EN) · Dimitrios Gunopulos ·

    Distilling Vision Transformers for Distortion-Robust Representation Learning

    Self-supervised learning has achieved remarkable success in learning visual representations from clean data, yet remains challenging when clean observations are sparse or not available at all. In this paper, we demonstrate that pretrained vision models can be leveraged to learn d…