Vision Transformer finetuning benefits from non-smooth components

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-04 04:00

一篇新发表在arXiv上的研究论文探讨了Vision Transformer中的“可塑性”概念，将其定义为模型组件内部的平均变化率。研究表明，优先考虑具有高可塑性的组件（如注意力模块和前馈层）可以提高微调性能。这一发现挑战了平滑性总是对Transformer模型有益的传统观念，为其功能特性提供了新的视角。 AI

影响挑战了关于Transformer平滑性的传统假设，可能指导未来的模型适应策略。

排序理由发表在arXiv上的学术论文，详细介绍了关于模型架构的新发现。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv stat.ML TIER_1 English(EN) · Ambroise Odonnat, Laetitia Chapel, Romain Tavenard, Ievgen Redko · 2026-06-04 04:00

Vision Transformer Finetuning Benefits from Non-Smooth Components

arXiv:2602.06883v3 Announce Type: replace-cross Abstract: The smoothness of the transformer architecture has been extensively studied in the context of generalization, training stability, and adversarial robustness. However, its role in transfer learning remains poorly understood…

报道来源 [1]

Vision Transformer Finetuning Benefits from Non-Smooth Components

相关实体

相关话题