摘要

为解决电力系统中存在的多种时间尺度下经济调度和发电控制的协同问题,即长时间尺度下优化,短时间尺度下优化和实时控制的问题,本文提出了一种统一时间尺度的实时经济发电调度和控制框架,并为该框架提出了懒惰强化学习方法(Lazy reinforcement learning, LRL).该方法将懒惰控制器引入以人工社会–计算实验–平行执行和社会系统为基础的强化学习中,使得机组组合,经济调度,自动发电控制和发电命令调配的问题有机结合在一起,取代过去传统的发电控制框架.为了减少仿真所需的真实时间,平行系统包含多个虚拟系统和一个真实系统.仿真实验比较了懒惰学习算法,松弛人工网络以及4 608种组合常规发电控制算法在IEEE新英格兰10机39节点仿真系统的控制效果.实验表明,懒惰强化学习方法的控制效果最优.仿真结果验证了懒惰强化学习方法在基于ACP和社会系统的REG框架下具有有效性和可行性.