English(EN) When Does Deep RL Beat Calibrated Baselines? A Benchmark Study on Adaptive Resource Control

深度强化学习算法在资源控制基准测试中难以超越校准基线

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-27 04:00

一项新的基准研究RLScale-Bench已被开发出来，用于评估用于自适应资源控制的深度强化学习（DRL）算法。研究发现，在各种工作负载下，一个经过适当校准的基于规则的自动扩展器在成本方面通常优于主流DRL算法。然而，DRL算法在处理突发流量和闪购流量方面显示出潜力。研究还强调，离散动作算法在避免约束违规方面明显优于连续动作算法，并且没有一种DRL算法在所有测试的工作负载中都占主导地位。 AI

影响强调了在资源控制的DRL中进行更好校准和奖励工程的必要性，表明当前方法可能无法超越更简单的基线。

排序理由该集群包含一篇学术论文，详细介绍了DRL算法的新基准和评估协议。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Guilin Zhang, Chuanyi Sun, Kai Zhao, Shahryar Sarkani, John Fossaceca · 2026-05-27 04:00

深度强化学习何时能超越校准基线？一项关于自适应资源控制的基准研究

arXiv:2605.26418v1 Announce Type: cross Abstract: A properly calibrated rule-based autoscaler can beat every one of six mainstream deep reinforcement learning (DRL) algorithms on cost across every workload we test - so when, if ever, does DRL actually help? We study this in RLSca…

报道来源 [1]

深度强化学习何时能超越校准基线？一项关于自适应资源控制的基准研究

相关实体

相关话题