PulseAugur
实时 20:53:00

OpenAI发布Safety Gym以衡量安全强化学习的进展

OpenAI推出了Safety Gym,这是一套新的工具和环境,旨在评估强化学习代理在训练过程中的安全性。该计划解决了“安全探索”的挑战,即代理通过试错学习,但可能会遇到危险行为。Safety Gym利用约束强化学习,该框架结合了任务完成的奖励函数和强制执行安全约束的成本函数,旨在开发能够有效学习而不会造成伤害的AI系统。 AI

排序理由 OpenAI发布了一个用于评估AI安全性的研究工具和框架。

在 OpenAI News 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

OpenAI发布Safety Gym以衡量安全强化学习的进展

报道来源 [1]

  1. OpenAI News TIER_1 English(EN) ·

    Safety Gym

    We’re releasing Safety Gym, a suite of environments and tools for measuring progress towards reinforcement learning agents that respect safety constraints while training.