研究人员开发了一个强化学习框架来控制和稳定双转子气动系统(TRAS)。采用了双延迟深度确定性策略梯度(TD3)算法,因为它适用于连续状态和动作空间,无需系统模型。仿真结果证明了RL控制器的有效性,并在风扰下以及在真实实验室实验中与传统的PID控制器进行了进一步验证。 AI
影响 展示了强化学习在复杂气动系统控制方面的新颖应用。
排序理由 这是一篇研究论文,详细介绍了强化学习算法在特定控制系统中的新颖应用。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →