OpenAI 发布了 Gym Retro 的完整版本,这是一个用于强化学习研究的平台,现已支持跨多个经典游戏机的超过 1000 款游戏。此次扩展旨在促进对智能体如何在不同游戏之间泛化其能力的研究,超越单一任务优化。此次发布还包括 OpenAI 用于集成新游戏的工具,使研究人员能够添加更多游戏并研究智能体行为,包括潜在的奖励耕种问题。 AI
排序理由 OpenAI 发布了一个用于强化学习的研究平台和工具,这对研究界做出了重大贡献,但并非前沿模型发布或重大产品发布。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →