English(EN) Inheritance Between Feedforward and Convolutional Networks via Model Projection

模型投影实现神经网络架构继承

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-08 04:00

研究人员引入了一种称为模型投影的方法，以实现不同神经网络架构之间的有效迁移学习。该技术允许广义卷积网络（GCNN）的属性被广义前馈网络（GFFN）继承。通过冻结卷积子函数并学习标量系数，模型投影创建了一个类似于GFFN的可训练结构，从而促进了参数高效的迁移学习。在ImageNet预训练模型上的实验表明，这种方法与现有的迁移学习方法相比具有竞争力，并可作为下游任务微调的有力初始化。 AI

影响实现了不同类型神经网络之间更有效的迁移学习，可能加快模型开发速度并降低计算成本。

排序理由这是一篇详细介绍神经网络架构之间迁移学习新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv stat.ML TIER_1 English(EN) · Nicolas Ewen, Jairo Diaz-Rodriguez, Kelly Ramsay · 2026-06-08 04:00

前馈网络与卷积网络间的继承通过模型投影

arXiv:2602.06245v2 Announce Type: replace Abstract: Neural-network techniques are often transferred across architecture families by analogy, but such transfer is valid only when the assumptions required by a technique are preserved. We introduce this idea as inheritance between m…

报道来源 [1]

前馈网络与卷积网络间的继承通过模型投影

相关实体

相关话题