研究人员推出了一种名为卷积近邻(ConvNN)的新型框架,它统一了卷积神经网络(CNN)和 Transformer。该论文认为,这两种架构都是 k-近邻聚合的特例,区别在于邻居的选择方式:CNN 使用空间邻近性,而 Transformer 使用特征相似性。通过配置相似性函数和邻居选择策略,ConvNN 可以在局部和全局聚合之间实现连续的频谱。 AI
影响 这项研究提出了一个统一的计算机视觉架构框架,可能简化模型设计并实现新的混合方法。
排序理由 该集群包含一篇详细介绍新研究框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →