研究人员开发了一个深层强化学习框架,用于优化NASA Carruthers Geocorona天文台任务的操作调度。该系统使用“活动块”抽象和动态动作掩码来管理功率和热限制等复杂约束,生成优于传统启发式方法的可用调度。该框架从任务开始时就作为默认调度器实现,证明了其在实时航天器操作中的可靠性以及在六小时内重新训练的能力。 AI
影响 展示了深层强化学习在科学任务中复杂、实时操作调度方面的实际应用和可靠性。
排序理由 详细介绍深层强化学习在特定科学任务中新颖应用的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →