PulseAugur
实时 09:33:48
English(EN) Interpolation between Convolution and Attention via K-Nearest Neighbors

新框架通过 k-近邻统一 CNN 和 Transformer

研究人员推出了一种名为卷积近邻(ConvNN)的新型框架,它统一了卷积神经网络(CNN)和 Transformer。该论文认为,这两种架构都是 k-近邻聚合的特例,区别在于邻居的选择方式:CNN 使用空间邻近性,而 Transformer 使用特征相似性。通过配置相似性函数和邻居选择策略,ConvNN 可以在局部和全局聚合之间实现连续的频谱。 AI

影响 这项研究提出了一个统一的计算机视觉架构框架,可能简化模型设计并实现新的混合方法。

排序理由 该集群包含一篇详细介绍新研究框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Mingi Kang ·

    Interpolation between Convolution and Attention via K-Nearest Neighbors

    arXiv:2606.14725v1 Announce Type: new Abstract: The shift from Convolutional Neural Networks to Transformers has reshaped computer vision, yet these two architectural families are typically viewed as fundamentally distinct. Convolutional Neural Networks are defined by spatially l…