PulseAugur
实时 11:17:46
实体 Conservative Q-Learning for Offline Reinforcement Learning

Conservative Q-Learning for Offline Reinforcement Learning

PulseAugur coverage of Conservative Q-Learning for Offline Reinforcement Learning — every cluster mentioning Conservative Q-Learning for Offline Reinforcement Learning across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
关系
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_93675 ·

    Diffusion-SAC通过AI增强无人机网络控制

    研究人员开发了一种名为Diffusion-SAC的新方法,该方法将离线强化学习与去噪扩散概率模型相结合,以优化6G通信无人机(UAV)网络的控制。该方法旨在通过从静态数据集中学习富有表现力的策略来提高设备的能源效率和公平性,即使在数据有限的情况下也是如此。模拟表明,Diffusion-SAC优于现有的离线RL基线,表现出更稳定的收敛性和更高的奖励,从而在数据效率、能耗和吞吐量方面取得了显著的改进。