PulseAugur
实时 20:18:56
None Learning Safely Without Knowing the World:COMPASS-Hedge

新算法在对抗性和随机环境中平衡在线学习

研究人员推出了一种新颖的在线学习算法 COMPASS-Hedge,旨在平衡对抗性和随机环境中的遗憾保证,同时保持基线安全。据报道,该算法是第一个在对抗性环境中实现最小最大最优遗憾,在随机环境中实现实例最优遗憾,并针对固定比较器实现最小遗憾,所有这些都无需进行参数调整或预先了解环境。COMPASS-Hedge 利用自适应伪遗憾缩放和基于阶段的攻击,并采用感知比较器的混合策略来实现这些目标。 AI

影响 为在线学习算法引入了新的理论框架,有望提高在不确定环境中运行的 AI 系统的鲁棒性和效率。

排序理由 该集群包含一篇介绍新算法的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 · Ting Hu, Luanda Cai, Manolis Vlatakis ·

    Learning Safely Without Knowing the World:COMPASS-Hedge

    arXiv:2603.22348v3 Announce Type: replace Abstract: Online learning algorithms often face a fundamental trilemma: balancing regret guarantees between adversarial and stochastic settings and providing baseline safety against a fixed comparator. While existing methods excel in one …