研究人员Bartłomiej Cupiał和Maciej Wołczyk观察到他们训练用于玩NetHack的神经网络的性能显著下降。该模型之前一直稳定得分在5000分左右,但突然开始只能得3000分,下降了40%。尽管进行了广泛的故障排除,包括代码回滚、恢复软件堆栈以及从头开始重建整个系统,但性能问题仍然存在。 AI
影响 凸显了强化学习模型潜在的脆弱性以及诊断性能回归的挑战。
排序理由 该集群描述了一项研究发现,涉及神经网络在游戏环境中意外的性能下降。[lever_c_demoted from research: ic=1 ai=1.0]
在 HN — machine learning stories 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →