PulseAugur
实时 07:38:42

新的强化学习框架增强了鲁棒轨迹优化

研究人员开发了一个新的框架,用于通过机会约束强化学习进行鲁棒轨迹优化。该方法通过首先计算标称轨迹,然后使用强化学习通过闭环校正律对其进行优化来处理初始条件和过程噪声中的不确定性。该方法在地球-火星转移和火箭着陆问题上进行了测试,证明了其在确保不同场景下的概率可行性的同时,保持具有竞争力的燃料成本的能力。 AI

排序理由 该集群包含一篇详细介绍轨迹优化新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Marco Sagliano ·

    Distribution-Agnostic Robust Trajectory Optimization via Chance-Constrained Reinforcement Learning

    This paper presents a distribution-agnostic robust trajectory-optimization framework based on chance-constrained reinforcement learning. The uncertainty is represented here through initial conditions and process noise, with the only requirement being that it can be sampled. A det…