实体 Xiaoji Zheng

Xiaoji Zheng

PulseAugur coverage of Xiaoji Zheng — every cluster mentioning Xiaoji Zheng across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_93861 · Jun 16 · 04:00

新框架通过结合模仿学习和强化学习改进自动驾驶模型

研究人员推出CoIRL-AD，一个用于训练自动驾驶模型的新框架，该框架在离线设置中结合了模仿学习（IL）和强化学习（RL）。该方法旨在通过解耦IL和RL目标并使用想象中的滚动来估计奖励，从而提高泛化能力，尤其是在罕见场景下。在nuScenes基准上的实验表明，与现有的基于IL的方法相比，CoIRL-AD提高了鲁棒性和跨城市泛化能力。