English(EN) Retro Contest: Results

OpenAI 复古竞赛凸显强化学习泛化挑战与成功

作者 PulseAugur 编辑部 · [2 个来源] · 2018-04-05 07:00

OpenAI 已结束其复古竞赛，该竞赛挑战参赛者开发能够从先验经验泛化到新的、未见过电子游戏关卡的强化学习算法。竞赛使用基于《刺猬索尼克》关卡的基准，表现最佳的解决方案主要涉及微调现有算法，如 PPO 和 Rainbow DQN。尽管获胜算法通过迁移学习取得了显著改进，但仍未达到人类的性能水平，表明泛化能力存在巨大差距。 AI

排序理由该集群描述了专注于强化学习泛化的竞赛结果，包括技术报告和基线结果，属于研究范畴。

在 OpenAI News 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

OpenAI News TIER_1 English(EN) · 2018-06-22 07:00

Retro Contest: Results

The first run of our Retro Contest—exploring the development of algorithms that can generalize from previous experience—is now complete.
OpenAI News TIER_1 English(EN) · 2018-04-05 07:00

Retro Contest

We’re launching a transfer learning contest that measures a reinforcement learning algorithm’s ability to generalize from previous experience.

报道来源 [2]

Retro Contest: Results

Retro Contest

相关话题