PulseAugur
实时 01:25:30
English(EN) Activation-Free Backbones for Image Recognition: Polynomial Alternatives within MetaFormer-Style Vision Models

视觉模型摒弃激活函数,采用多项式替代方案

研究人员开发了用于视觉模型的新型无激活骨干网络架构,使用多项式函数替代ReLU或GELU等传统逐点非线性函数。这些集成到MetaFormer框架中的新颖模块,在ImageNet分类和语义分割等任务上,表现出与基于激活的模型相当或更优的性能。研究还表明,这些多项式变体在需要较低计算成本的情况下,性能优于先前专门的多项式网络。 AI

影响 引入了一种新的视觉模型架构方法,可能带来更高效、更鲁棒的图像识别系统。

排序理由 详细介绍新型模型架构和实验结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

视觉模型摒弃激活函数,采用多项式替代方案

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Grigorios G. Chrysos ·

    图像识别的无激活骨干:MetaFormer风格视觉模型中的多项式替代方案

    Modern vision backbones treat pointwise activations (e.g., ReLU, GELU) and exponential softmax as essential sources of nonlinearity, but we demonstrate they are not required within MetaFormer-style vision backbones. We design activation-free polynomial alternatives for three core…