研究人员开发了一个新的在线凸优化(OCO)框架,即使在有限且有噪声的成对探测预算下,也能改进最坏情况下的遗憾。所提出的方法统一了次线性最佳专家查询和成对反馈,表明次线性的噪声探测预算可以被证明在全反馈OCO机制中增强遗憾。该分析通过方差缩减和连续指数权重(Continuous Exponential Weights)的二阶分析来量化探测的好处,从而得出严格的遗憾保证。 AI
排序理由 该集群包含一篇详细介绍在线凸优化新理论框架的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →