研究人员开发了用于带截止时间和部分反馈的在线数据包调度的算法,旨在最小化 alpha-regret。这些算法实现了 O(sqrt(KT)) alpha-regret 的上限,与标准的 bandit 设置相匹配。对于截止时间最多为一个时钟周期的情况,一种确定性算法提供了最紧密的竞争比。值得注意的是,当不同数据包类型的数量有限时,这些算法可以突破已建立的 Phi 竞争比障碍。 AI
排序理由 该集群包含一篇学术论文,详细介绍了计算机科学中特定问题的算法和理论结果。[lever_c_demoted from research: ic=1 ai=0.7]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →