English(EN) Memory-Efficient Meta-Reinforcement Learning for Adaptive Safety-Critical Control in Adversarial Spacecraft Proximity Operations

Mamba 和 PPO 在航天器控制中实现卓越安全性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-17 04:00

一篇新研究论文探讨了各种循环神经网络架构和强化学习算法在航天器近距离操作中自适应安全关键控制的有效性。该研究特别比较了长短期记忆（LSTM）、门控循环单元（GRU）和选择性状态空间模型（Mamba）网络，以及近端策略优化（PPO）和软Actor-Critic（SAC）训练算法。结果表明，Mamba 与 PPO 结合，即使在对抗性场景下，在任务完成、安全性和燃油效率方面也表现出卓越的性能。 AI

影响展示了先进人工智能控制系统在安全关键航空航天应用中的潜力。

排序理由学术论文发布在 arXiv 上，详细介绍了元强化学习的新颖应用。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Alejandro Posadas-Nava, Richard Linares, Minduli Wijayatunga · 2026-06-17 04:00

Memory-Efficient Meta-Reinforcement Learning for Adaptive Safety-Critical Control in Adversarial Spacecraft Proximity Operations

arXiv:2606.17414v1 Announce Type: new Abstract: Autonomous spacecraft rendezvous and proximity operations (RPO) require controllers that guarantee safety under thrust constraints while minimizing fuel expenditure. Input-constrained control barrier functions (ICCBFs) provide a con…

报道来源 [1]

Memory-Efficient Meta-Reinforcement Learning for Adaptive Safety-Critical Control in Adversarial Spacecraft Proximity Operations

相关实体

相关话题