摘要

针对含有需求响应的电-热综合能源系统优化调度问题,文章提出了一种基于深度强化学习的求解方法。建立了综合能源系统用户的激励型电-热需求响应模型,并构建了以系统运行总成本最低为目标的优化调度模型;将电-热综合能源系统调度问题与马尔科夫决策过程相结合,定义智能体的状态、动作空间以及奖励函数;基于调度问题的连续性以及不同强化学习算法的特点,选用收敛速度快且实现简单的近端策略优化算法,搭建深度神经网络框架,对问题进行求解,利用马尔科夫与环境交互的方式进行学习和训练,最大化累计奖励。结果表明:在强化学习作用下所得调度方案可以提高系统的风光消纳率,保证系统经济性和安全性,能有效辅助调度人员做出合理决策。

全文