PulseAugur
实时 13:09:40
English(EN) ITNet: A Learnable Integral Transform That Subsumes Convolution, Attention, and Recurrence

ITNet架构统一了卷积、注意力和循环

研究人员推出了一种新颖的神经网络架构ITNet,它将卷积、注意力和循环统一为一种可学习的积分变换。该架构使用一个可学习的核(实现为MLP)来模拟成对交互,使其能够根据数据调整其行为。通过调整参数,ITNet可以恢复各种现有架构的功能,包括LSTM、GRU、S4、Mamba和自注意力。该模型在ImageNet-1K、GLUEModelNet40、VQA v2和NLVR2等多个基准测试中都表现出具有竞争力或更优的性能。 AI

影响 统一了不同的神经网络架构,可能简化模型设计并提高各种任务的性能。

排序理由 该项目是一篇介绍新神经网络架构的学术论文。 [lever_c_research降级:ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

ITNet架构统一了卷积、注意力和循环

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Ashim Dhor, Rasel Mondal, Pin Yu Chen ·

    ITNet: A Learnable Integral Transform That Subsumes Convolution, Attention, and Recurrence

    arXiv:2606.19538v1 Announce Type: new Abstract: Convolutional networks, recurrent networks, and transformers each encode different inductive biases -- locality, sequential memory, and content-dependent pairwise interaction -- and have remained mathematically distinct since their …