English(EN) Does Your Neural Network Extrapolate? Feature Engineering as Identifiability Bias for OOD Generalization

新研究将神经网络 OOD 泛化与特征工程联系起来

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-08 09:25

研究人员发现，深度神经网络之所以常常无法学习到能够泛化到分布外 (OOD) 数据的表示，是因为它们无法将特征学习与数据生成过程的可识别性分离开来。研究表明，特征图、标签图和模型类的选择决定了假设的数据生成过程，并控制着 OOD 泛化，仅表示形式的改变就会导致 OOD 任务的性能差异巨大。该论文提出，成功的 OOD 推断不仅需要正确的特征，还需要能够表达目标和训练数据的模型类，并且这些数据能够覆盖相关的表示空间。 AI

影响指出了当前神经网络架构在分布外泛化方面的一个关键限制，为模型开发提供了新的途径。

排序理由该集群包含一篇学术论文，详细介绍了关于神经网络泛化的一项新理论发现。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Nino Antulov-Fantulin · 2026-05-08 09:25

你的神经网络能外推吗？特征工程作为 OOD 泛化的可识别性偏差

Successful deep neural networks discover salient features of data. We show when and why they fail to learn out-of-distribution (OOD)-relevant representations from an in-distribution (ID) training window. This requires decoupling feature learning from data-generating-process (DGP)…

报道来源 [1]

你的神经网络能外推吗？特征工程作为 OOD 泛化的可识别性偏差

相关实体

相关话题