PulseAugur
实时 11:42:55
English(EN) Beyond the Training Distribution: Mapping Generalization Boundaries in Neural Program Synthesis

神经程序合成模型在泛化到训练数据之外时遇到困难

研究人员开发了一个受控环境,以严格测试神经程序合成模型的泛化能力。他们的实验表明,虽然 Transformer 模型在已知数据上表现良好,但在生成新颖程序方面却面临显著困难,性能下降超过 30%。研究表明,增加计算能力的回报递减,遵循对数线性关系,并表明最大化跨各种流形(manifolds)的训练多样性对于稳健的泛化至关重要。研究结果强调了需要新的基于搜索的方法来克服当前的扩展限制。 AI

影响 强调了 Transformer 模型在泛化到新颖程序合成方面的局限性,并提出了需要新的方法。

排序理由 关于神经程序合成中泛化边界的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

神经程序合成模型在泛化到训练数据之外时遇到困难

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Henrik Voigt, Michael Habeck, Joachim Giesen ·

    Beyond the Training Distribution: Mapping Generalization Boundaries in Neural Program Synthesis

    arXiv:2604.27551v1 Announce Type: cross Abstract: Large-scale transformers achieve impressive results on program synthesis benchmarks, yet their true generalization capabilities remain obscured by data contamination and opaque training corpora. To rigorously assess whether models…

  2. arXiv cs.CL TIER_1 English(EN) · Joachim Giesen ·

    Beyond the Training Distribution: Mapping Generalization Boundaries in Neural Program Synthesis

    Large-scale transformers achieve impressive results on program synthesis benchmarks, yet their true generalization capabilities remain obscured by data contamination and opaque training corpora. To rigorously assess whether models are truly generalizing or merely retrieving memor…