研究人员开发了一种离线强化学习方法,用于控制托卡马克(对聚变能源研究至关重要的装置)内的等离子体旋转剖面。该方法仅使用 DIII-D 托卡马克的历史数据进行训练,解决了在没有精确模拟器的情况下控制复杂高维动力学所面临的挑战。所开发的策略利用概率模型进行训练 rollout,在部署到 DIII-D Tokamak 后显示出有希望的结果。 AI
影响 展示了一种使用历史数据将强化学习应用于控制复杂物理系统的新方法,可能适用于其他科学和工程领域。
排序理由 详细介绍强化学习在新颖应用中解决复杂科学问题的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →