PulseAugur
实时 16:04:00
实体 Randomized Least Squares Value Iteration

Randomized Least Squares Value Iteration

PulseAugur coverage of Randomized Least Squares Value Iteration — every cluster mentioning Randomized Least Squares Value Iteration across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_65973 ·

    RLSVI算法通过随机探索实现联合差分隐私

    研究人员开发了一种新的强化学习算法隐私分析方法,特别关注随机最小二乘值迭代(RLSVI)。他们的工作展示了RLSVI中用于探索的固有噪声如何同时提供差分隐私保护。该研究提供了这种隐私保证的数学表征,表明在表格马尔可夫决策过程中,RLSVI是$(\varepsilon(\delta),\delta)$-联合差分隐私的。