一项新的基准研究RLScale-Bench已被开发出来,用于评估用于自适应资源控制的深度强化学习(DRL)算法。研究发现,在各种工作负载下,一个经过适当校准的基于规则的自动扩展器在成本方面通常优于主流DRL算法。然而,DRL算法在处理突发流量和闪购流量方面显示出潜力。研究还强调,离散动作算法在避免约束违规方面明显优于连续动作算法,并且没有一种DRL算法在所有测试的工作负载中都占主导地位。 AI
影响 强调了在资源控制的DRL中进行更好校准和奖励工程的必要性,表明当前方法可能无法超越更简单的基线。
排序理由 该集群包含一篇学术论文,详细介绍了DRL算法的新基准和评估协议。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →