PulseAugur
实时 02:42:36

新的贝叶斯辅助置信序列改进不确定性量化

研究人员开发了一个新的贝叶斯辅助框架,用于构建置信序列,为有界均值提供时间一致的不确定性量化。该方法使用贝叶斯预测模型自适应地选择马丁格尔更新,以最大化预测对数增长,即使在先验模型错误指定的情况下也能确保有效性。该过程被证明在Wasserstein一致性下渐近对数最优,可与预言机程序相媲美。实验表明,信息性先验可以显著缩小置信区间并减少采样需求,应用包括LLM评估。 AI

影响 这个新的统计框架可以提高LLM评估等应用的效率并减少采样工作量。

排序理由 该集群包含一篇详细介绍新统计方法的学术论文。

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新的贝叶斯辅助置信序列改进不确定性量化

报道来源 [2]

  1. arXiv stat.ML TIER_1 English(EN) · Valentin Kilian, Stefano Cortinovis, Fran\c{c}ois Caron ·

    Asymptotically Log-Optimal Bayes-Assisted Confidence Sequences for Bounded Means

    arXiv:2605.07964v1 Announce Type: new Abstract: Confidence sequences based on test martingales provide time-uniform uncertainty quantification for the mean of bounded IID observations without parametric distributional assumptions. Their practical efficiency, however, depends stro…

  2. arXiv stat.ML TIER_1 English(EN) · François Caron ·

    Asymptotically Log-Optimal Bayes-Assisted Confidence Sequences for Bounded Means

    Confidence sequences based on test martingales provide time-uniform uncertainty quantification for the mean of bounded IID observations without parametric distributional assumptions. Their practical efficiency, however, depends strongly on the choice of martingale updates, and ma…