PulseAugur
实时 08:05:19
English(EN) Multiple Descents in Deep Learning as a Sequence of Order-Chaos Transitions in LSTM Networks

在LSTM网络中观察到新的“多重下降”现象

研究人员在长短期记忆(LSTM)网络中发现了一种新颖的“多重下降”现象,即在过度训练后,模型的性能会经历反复的上升和下降周期。分析表明,这些性能周期与模型在有序和混沌状态之间的相变有关。最佳训练点始终位于这些相变之间的临界点,而最佳模型性能通常出现在从有序到混沌的初始转变处,此时“混沌边缘”最宽,有利于更好地探索权重配置。 AI

影响 这项研究揭示了神经网络训练中的一种新动态,可能为优化模型性能和稳定性提供见解。

排序理由 该集群包含一篇学术论文,详细介绍了在深度学习模型中观察到的一种新现象。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Wenbo Wei, Fan Xu, Nicholas Chong Jia Le, Choy Heng Lai, Ling Feng ·

    Multiple Descents in Deep Learning as a Sequence of Order-Chaos Transitions in LSTM Networks

    arXiv:2505.20030v2 Announce Type: replace-cross Abstract: We observe a novel `multiple-descent' phenomenon during the learning process of a recurrent neural network called long-short-term memory (LSTM) networks during its training on real-world task, in which the performance goes…