OpenAI发布Procgen Benchmark以测试强化学习智能体的泛化能力

作者 PulseAugur 编辑部 · [1 个来源] · 2019-12-03 08:00

OpenAI推出了Procgen Benchmark，这是一套包含16个程序化生成环境的工具集，旨在评估强化学习智能体泛化其技能的有效性。该基准测试旨在通过要求智能体在大量多样化的关卡上进行训练，然后在未见过的关卡上进行测试，来解决传统强化学习环境中观察到的过拟合问题。该新平台旨在加速研究社区内更强大、更具泛化能力的强化学习算法的开发。 AI

排序理由 OpenAI发布了一套用于强化学习研究的基准测试工具集。

在 OpenAI News 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

OpenAI发布Procgen Benchmark以测试强化学习智能体的泛化能力

报道来源 [1]

OpenAI News TIER_1 English(EN) · 2019-12-03 08:00

Procgen Benchmark

We’re releasing Procgen Benchmark, 16 simple-to-use procedurally-generated environments which provide a direct measure of how quickly a reinforcement learning agent learns generalizable skills.

报道来源 [1]

Procgen Benchmark

相关话题