摘要

针对含需求响应的热电联产系统(CHPs)调度优化问题,提出一种基于深度强化学习(DRL)的调度策略。首先将CHPs调度优化问题建模为马尔科夫决策过程(MDP);其次使用深度Q网络(DQN)算法对CHPs进行优化,在经济性调度的基础上,通过可中断电负荷补偿,引入电力需求响应,以便进一步降低耗能费用;最后通过混合整数线性规划模型(MILP)对DQN算法进行了验证。研究表明:DRL能充分发挥模型的自主性,通过与环境不断交互得到最优动作;通过可中断负荷需求响应,CHPs成本降低了3.50%。