实体
Q-network
Q-network
PulseAugur coverage of Q-network — every cluster mentioning Q-network across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新框架在不确定性下利用AI进行地质导向
一个新框架整合了粒子滤波和强化学习,以在地质不确定性下优化地质导向决策。该方法使用粒子滤波进行概率性地下解释,并使用基于价值的强化学习进行顺序决策。该框架与近似动态规划和深度Q学习进行了评估,展示了改进的导向平滑度和操作洞察力。
-
多智能体强化学习高效测绘河流羽流
研究人员开发了一种新颖的多智能体强化学习方法,用于河流羽流的长期测绘,并以Douro河为例进行了演示。该方法采用一个中央协调器,该协调器与多个自主水下航行器(AUVs)间歇性通信,以收集数据并发出指令。该系统集成了时空高斯过程回归与多头Q网络控制器,与现有基准相比,显示出更高的准确性和操作续航能力。