English(EN) Offline Reinforcement Learning for Plasma Control in Nuclear Fusion: Codebase and Benchmark

新的基准测试标准了核聚变等离子体控制的离线强化学习

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 04:00

研究人员推出了RL4F，这是一个旨在标准化核聚变等离子体控制中离线强化学习评估的新基准测试。该基准测试利用DIII-D托卡马克的历史数据创建了真实的控制任务，解决了在线实验成本高昂且风险大的挑战。研究发现，离线基于模型的强化学习方法总体表现最佳，但没有一种方法在所有任务中都表现出色，这强调了在复杂的聚变控制场景中进行有效动力学建模的必要性。代码库、数据集和评估框架已发布，以鼓励在聚变控制和离线强化学习算法开发领域进行进一步研究。 AI

影响标准化了聚变领域离线强化学习的评估，有望加速两个领域的进展。

排序理由学术论文，为特定研究领域引入了新的基准测试和代码库。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Yang Fu, Haomin Bao, Rohit Sonker, Xiaoyan Hu, Aravind Venugopal, Jeff Schneider, Jiayu Chen · 2026-06-09 04:00

面向核聚变等离子体控制的离线强化学习：代码库与基准测试

arXiv:2606.07550v1 Announce Type: cross Abstract: Offline reinforcement learning (RL) offers a promising route for developing plasma controllers from historical tokamak data, since online trial-and-error on real devices is costly and risky. However, progress in this direction rem…

报道来源 [1]

面向核聚变等离子体控制的离线强化学习：代码库与基准测试

相关实体

相关话题