PulseAugur
实时 20:47:44
实体 Lipschitz bandits

Lipschitz bandits

PulseAugur coverage of Lipschitz bandits — every cluster mentioning Lipschitz bandits across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_114377 ·

    新算法在有限反馈的在线学习中利用动作相似性

    研究人员开发了用于在线学习问题的新算法,这些问题中的动作具有固有的相似性,例如由根树结构表示的动作。这些算法旨在利用这些相似性来提高性能,尤其是在反馈有限的情况下。该研究为标准单点老虎机反馈建立了一个不可能的结果,证明了其无法利用动作相似性。然而,所提出的算法通过适应更丰富的反馈模型,并将总动作数替换为在遗憾界限中具有相似性感知的有效数量,提供了两全其美的保证。