摘要

热泵供热系统广泛应用于住宅建筑,其优化控制对于提高需求侧的能源效率至关重要。基于模型的控制方法需要精确的建筑模型,而无模型控制方法前期效果较差,收敛速度较慢。针对这些问题,提出了1种基于Deep Q-Learning及其改进算法的强化学习方法。该方法具有较快收敛速度,能够根据不同建筑环境自适应学习建模,在热舒适收益和能耗成本之间寻找平衡。北京市某近零能耗住宅建筑实际验证结果表明,该算法与基准策略相比综合收益提高15.3%。