实体 Multi-Agent Proximal Policy Optimization

Multi-Agent Proximal Policy Optimization

PulseAugur coverage of Multi-Agent Proximal Policy Optimization — every cluster mentioning Multi-Agent Proximal Policy Optimization across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 3

发布 · 30天

90 天内 0

论文 · 30天

90 天内 3

层级分布 · 90 天

主题

最近 · 第 1/1 页 · 共 3 条

TOOL · CL_51856 · May 25 · 05:13

新“Mode 0”V2X 类别被提议用于增强道路安全

一篇新研究论文提出了一种名为“Mode 0”的新型 3GPP V2X 资源分配类别，该类别集成了路侧计算单元（RCU）以增强安全通信。当前框架在高密度交通和复杂危险场景下存在不足。Mode 0 及其从被动到主动的用户设备（UE）参与的频谱范围，旨在通过利用 RCU 进行感知、通信和本地计算来解决这些限制。使用多智能体近端策略优化（MAPPO）进行的模拟表明，Mode 0 配置显著提高了数据包传输率，并满足了关键的延迟安全要求。
RESEARCH · CL_41847 · May 20 · 13:14

AI研究通过新的RL框架推进自动驾驶安全

两篇新研究论文探讨了用于更安全自动驾驶的先进强化学习技术。第一篇论文介绍了一种多智能体强化学习（MARL）方法，其中自动驾驶汽车和行人进行协同训练，通过更好地预测行人不可预测的行为，与基线方法相比，碰撞减少了30%。第二篇论文提出了一个认知-物理强化学习（CoPhy）框架，该框架整合了来自视觉-语言模型的知识，并使用预测性世界模型来确保安全和遵守驾驶意图，在基准测试中取得了最先进的结果。
TOOL · CL_49354 · May 16 · 03:35

AI框架动态部署充电车以应对灾害疏散

研究人员开发了一个名为ARMD的新框架，用于在自然灾害疏散期间为电动汽车动态部署移动充电车（MCT）。该框架通过使用多智能体近端策略优化方法协调多个MCT，解决了固定充电站过载的问题。该系统进行离线训练，并在在线进行优化，结合了时空预测器以进行实时路线更新。在模拟飓风疏散中的实验表明，与现有方法相比，ARMD显著降低了风险暴露，特别是在基础设施故障等中断情况下。

新“Mode 0”V2X 类别被提议用于增强道路安全

AI研究通过新的RL框架推进自动驾驶安全

AI框架动态部署充电车以应对灾害疏散