PulseAugur
实时 10:03:17
实体 Magik

Magik

PulseAugur coverage of Magik — every cluster mentioning Magik across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_123108 ·

    新的MAGIK框架支持RL智能体进行零样本知识迁移

    研究人员开发了MAGIK,一个旨在增强强化学习(RL)智能体知识迁移能力的新框架。该系统使RL智能体能够在不直接与目标环境交互的情况下,将其从先前学习的任务中获得的知识应用于新的、类似的任务。MAGIK利用想象机制在任务之间映射实体,从而实现现有策略的重用。在MiniGrid和MuJoCo环境中进行的实验表明,MAGIK能够以最少的人工标注示例有效地实现零样本迁移,并且优于相关的基线方法。