实体
XLand-MiniGrid
XLand-MiniGrid
PulseAugur coverage of XLand-MiniGrid — every cluster mentioning XLand-MiniGrid across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新的ULEE方法增强了AI代理的探索和适应能力
研究人员开发了ULEE,一种新颖的无监督元学习方法,旨在增强强化学习代理的探索和适应能力。该方法采用对抗性目标生成策略,将训练保持在代理当前能力边缘,以优化高效的多回合探索。与现有的DIAYN预训练等方法相比,ULEE在XLand-MiniGrid基准测试中表现出优越的性能,对新目标和环境动态提供了更好的零样本和少样本泛化能力。
-
Q-learning integration boosts offline In-Context RL performance
A new research paper explores the effectiveness of integrating Reinforcement Learning (RL) objectives into offline In-Context Reinforcement Learning (ICRL) methods. Experiments across over 150 datasets in GridWorld and …