PulseAugur
实时 12:39:24
实体 Xiaoji Zheng

Xiaoji Zheng

PulseAugur coverage of Xiaoji Zheng — every cluster mentioning Xiaoji Zheng across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_93861 ·

    新框架通过结合模仿学习和强化学习改进自动驾驶模型

    研究人员推出CoIRL-AD,一个用于训练自动驾驶模型的新框架,该框架在离线设置中结合了模仿学习(IL)和强化学习(RL)。该方法旨在通过解耦IL和RL目标并使用想象中的滚动来估计奖励,从而提高泛化能力,尤其是在罕见场景下。在nuScenes基准上的实验表明,与现有的基于IL的方法相比,CoIRL-AD提高了鲁棒性和跨城市泛化能力。