PulseAugur
实时 18:32:27
实体 pMDPs

pMDPs

PulseAugur coverage of pMDPs — every cluster mentioning pMDPs across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_16040 ·

    新方法学习不确定性MDP,参数估计更精确

    研究人员开发了一种新的马尔可夫决策过程(MDP)模型学习方法,该方法考虑了转移概率之间的依赖关系。该方法使用参数化MDP(pMDP)将转移概率表示为共享参数的函数,从而实现更准确的不确定性量化。所提出的技术将统计不确定性投影到参数空间,创建了一个可能近似正确(PAC)的不确定性模型,该模型尊重代数依赖关系,与传统方法相比,不确定性估计更精确。