研究人员开发了PIRS(Physics-Informed Reward Shaping,物理信息奖励塑造),一种用于通过深度强化学习优化建筑能源管理的新颖方法。PIRS用ISO 7730预测平均投票(PMV)公式取代了临时的舒适度代理,将舒适度信号建立在已建立的物理学基础上。这种方法增强了奖励的可解释性,并提供了一个符合标准的舒适度代理,而无需更改学习管道的其他组件。在CityLearn v2.1.2中的评估表明,PIRS在成本、碳排放和电力指标方面取得了与手动基线相当的性能,同时显著优于非物理基础设计,尤其是在负荷爬坡和每日峰值需求方面。 AI
影响 这项研究为能源管理系统中的强化学习奖励设计提供了一种更具可解释性且符合标准的方法。
排序理由 该集群包含一篇详细介绍基于AI的建筑能源管理新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →