研究人员开发了一个网络分布式多智能体强化学习(ND-MARL)框架,用于控制四旋翼飞行器集群。该方法将通信网络拓扑直接集成到决策过程中,使每个智能体能够仅基于少数邻居的信息进行行动。该系统展示了令人印象深刻的零样本可扩展性,在三个四旋翼飞行器的小群体上训练的策略无需重新训练即可成功控制多达250个智能体的集群。 AI
影响 这项研究引入了一个新颖的MARL框架,该框架展示了控制大型四旋翼飞行器集群的显著可扩展性,可能影响未来的自主无人机操作。
排序理由 这是一篇描述新颖的多智能体强化学习框架的研究论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →