实体 Youssef Mahran

Youssef Mahran

PulseAugur coverage of Youssef Mahran — every cluster mentioning Youssef Mahran across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 3

发布 · 30天

90 天内 0

论文 · 30天

90 天内 3

层级分布 · 90 天

主题

最近 · 第 1/1 页 · 共 3 条

TOOL · CL_65724 · Jun 2 · 04:00

强化学习采用动态熵调优以改进四旋翼飞行器控制

研究人员调查了动态熵调优在强化学习用于四旋翼飞行器控制中的影响。他们将随机策略（优化动作的概率分布）与确定性策略（选择单一动作）进行了比较。该研究使用了Soft Actor-Critic (SAC)算法来处理随机策略，并使用Twin Delayed Deep Deterministic Policy Gradient (TD3)来处理确定性策略。研究结果表明，动态熵调优通过减轻灾难性遗忘和提高探索效率，对四旋翼飞行器控制产生了积极影响。
TOOL · CL_65723 · Jun 2 · 04:00

四旋翼控制系统采用软Actor-Critic以提升性能

研究人员开发了一种利用强化学习（RL）方法，特别是软Actor-Critic（SAC）算法的四旋翼飞行器新型控制系统。该方法侧重于控制四旋翼的推力矢量，而不是直接操纵单个旋翼的速度。RL代理确定z轴上的推力百分比和期望的滚转角和俯仰角，然后由PID控制器处理以设置电机RPM。这种新的推力矢量控制策略与传统的RPM控制方法相比，显示出更快的训练时间和更平滑、更精确的路径跟踪。
TOOL · CL_65720 · Jun 2 · 04:00

强化学习有效控制双转子系统

研究人员开发了一个强化学习框架来控制和稳定双转子气动系统（TRAS）。采用了双延迟深度确定性策略梯度（TD3）算法，因为它适用于连续状态和动作空间，无需系统模型。仿真结果证明了RL控制器的有效性，并在风扰下以及在真实实验室实验中与传统的PID控制器进行了进一步验证。

强化学习采用动态熵调优以改进四旋翼飞行器控制

四旋翼控制系统采用软Actor-Critic以提升性能

强化学习有效控制双转子系统