PulseAugur
实时 13:16:53
English(EN) Sharp analysis of linear ensemble sampling

新分析表明线性集成采样可媲美汤普森采样

研究人员发表了对随机线性 bandits 中线性集成采样 (ES) 的新分析,证明了其在标准高斯扰动下的有效性。研究表明,ES 可以实现 \tilde O(d^{3/2}\sqrt n) 的遗憾值,集成大小为 m=\Theta(d\log n),其性能可媲美汤普森采样,同时计算成本相当。新颖的证明技术涉及将分析简化为独立布朗运动的时间均匀超额问题,为线性 bandits 中的随机探索提供了新视角。 AI

排序理由 学术论文发表在 arXiv 上,详细介绍了对现有算法的新分析。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · David Janz, Arya Akhavan, Csaba Szepesv\'ari ·

    Sharp analysis of linear ensemble sampling

    arXiv:2602.08026v2 Announce Type: replace Abstract: We analyse linear ensemble sampling (ES) with standard Gaussian perturbations in stochastic linear bandits. We show that for ensemble size $m=\Theta(d\log n)$, ES attains $\tilde O(d^{3/2}\sqrt n)$ high-probability regret, closi…