PulseAugur
实时 13:56:28
实体 XLand-MiniGrid

XLand-MiniGrid

PulseAugur coverage of XLand-MiniGrid — every cluster mentioning XLand-MiniGrid across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_91395 ·

    新的ULEE方法增强了AI代理的探索和适应能力

    研究人员开发了ULEE,一种新颖的无监督元学习方法,旨在增强强化学习代理的探索和适应能力。该方法采用对抗性目标生成策略,将训练保持在代理当前能力边缘,以优化高效的多回合探索。与现有的DIAYN预训练等方法相比,ULEE在XLand-MiniGrid基准测试中表现出优越的性能,对新目标和环境动态提供了更好的零样本和少样本泛化能力。

  2. TOOL · CL_53753 ·

    Q-learning integration boosts offline In-Context RL performance

    A new research paper explores the effectiveness of integrating Reinforcement Learning (RL) objectives into offline In-Context Reinforcement Learning (ICRL) methods. Experiments across over 150 datasets in GridWorld and …