研究人员开发了一种新的方法,可以在不通过模型运行样本的情况下估计宽的、随机初始化的多层感知器(MLP)的预期输出。这种“机制估计”方法利用了累积量和Hermite展开等工具,与传统的蒙特卡洛采样相比,可以提供更准确的结果,尤其适用于宽网络。该技术也更有效,所需的浮点运算(FLOPs)更少,并且在估计罕见事件和用于模型训练方面显示出特别的潜力,有可能降低灾难性的尾部风险。 AI
影响 提供了一种更有效、可能更安全的方法来训练模型,尤其是在减轻罕见但影响重大的风险方面。
排序理由 这是一篇研究论文,详细介绍了一种用于估计MLP输出的新理论和经验方法。
- Alignment Research Center
- Geoffrey Irving
- George Robinson
- Jess Riedel
- Mike Winer
- Monte Carlo sampling
- Paul Christiano
- ReLU
- Victor Lecomte
- Wilson Wu
AI 生成摘要 · Google Gemini · 来自 4 个来源。 我们如何撰写摘要 →