PulseAugur
实时 15:39:45
实体 sampling oracles

sampling oracles

PulseAugur coverage of sampling oracles — every cluster mentioning sampling oracles across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_109497 ·

    用于外生上下文MDP学习的新minimax PAC界限

    研究人员为外生上下文马尔可夫决策过程(MDP)中的学习开发了新的minimax PAC界限。该研究侧重于具有外生、独立同分布(i.i.d.)上下文的表格折扣MDP,这些上下文会影响奖励和转移。所提出的算法在策略评估、最佳值估计和最佳策略提取方面提供了改进的样本复杂度,其速率独立于上下文空间大小且是minimax最优的。