摘要

针对分布式能源大规模并网所带来的随机扰动问题,从自动发电控制角度提出一种具有优先回放功能和动作空间加权寻优策略的深度强化学习方法,即PRDDQN-AWM。所提方法可以加快启发式方法在平衡"探索-利用"过程中的寻优速度,和深度强化学习的采样效率,来获取强随机环境下分布式多区域电网的最优协同,进而解决分布式能源大规模并网所带来的随机扰动问题,促进分布式能源与电力系统兼容。对改进的IEEE标准两区域LFC模型及广东电网模型进行仿真,验证所提方法能够获得多区域最优协同控制,与多种智能算法相比,具有更快的收敛速度,更优的控制性能。