PulseAugur
实时 10:16:00
实体 Joël Charles-Rebuffé

Joël Charles-Rebuffé

PulseAugur coverage of Joël Charles-Rebuffé — every cluster mentioning Joël Charles-Rebuffé across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_80125 ·

    新算法BLINQ学习马尔可夫决策过程的Whittle指数

    研究人员开发了BLINQ,一种新颖的基于模型的算法,旨在学习马尔可夫决策过程(Markov Decision Processes)的Whittle指数。这种新方法构建了MDP的经验估计,然后计算指数,提供了已证实的收敛保证和学习时间的界限。数值实验表明,BLINQ在准确逼近方面比现有的Q-learning方法需要更少的样本,并且总体计算成本更低。