gymnasium
PulseAugur coverage of gymnasium — every cluster mentioning gymnasium across labs, papers, and developer communities, ranked by signal.
2 天有情绪数据
-
新基准测试AI在道德困境中的层级道德对齐能力
研究人员开发了MoralityGym,一个旨在评估AI代理在复杂道德困境中导航和遵守层级道德规范能力的新基准。该基准使用一种称为Morality Chains的新形式主义来表示道德约束,并在Gymnasium环境中呈现了98个电车难题风格的问题。使用安全强化学习(Safe RL)方法的初步测试突显了AI在道德推理方面的现有局限性,表明需要更先进的方法来确保AI系统在现实场景中以合乎道德且透明的方式运行。
-
New DR-Gym environment trains AI for electric utility demand response
Researchers have developed DR-Gym, an open-source Gymnasium-compatible environment to train reinforcement learning agents for optimizing electric utility demand-response programs. This simulator addresses the challenge …
-
新的EO-Gym环境训练AI代理进行交互式地球观测分析
研究人员推出了EO-Gym,这是一个专为地球观测(EO)代理设计的交互式框架。该环境支持多模态分析和工具使用,模拟现实世界中经常涉及扩展感兴趣区域和检索不同传感器历史数据的EO任务。创建了一个包含超过9000个轨迹的基准数据集EO-Gym-Data来评估代理性能,结果显示当前的大型视觉语言模型在交互式EO推理方面存在困难。在EO-Gym-Data上微调Qwen模型显著提高了其在这些任务上的性能。