OpenAI发布Safety Gym以衡量安全强化学习的进展

作者 PulseAugur 编辑部 · [1 个来源] · 2019-11-21 08:00

OpenAI推出了Safety Gym，这是一套新的工具和环境，旨在评估强化学习代理在训练过程中的安全性。该计划解决了“安全探索”的挑战，即代理通过试错学习，但可能会遇到危险行为。Safety Gym利用约束强化学习，该框架结合了任务完成的奖励函数和强制执行安全约束的成本函数，旨在开发能够有效学习而不会造成伤害的AI系统。 AI

排序理由 OpenAI发布了一个用于评估AI安全性的研究工具和框架。

在 OpenAI News 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

OpenAI News TIER_1 English(EN) · 2019-11-21 08:00

Safety Gym

We’re releasing Safety Gym, a suite of environments and tools for measuring progress towards reinforcement learning agents that respect safety constraints while training.

报道来源 [1]

Safety Gym

相关话题