摘要

为解决综合能源系统背景下电网面临的不断加重的随机扰动问题,从自动发电控制角度提出一种基于actor-critic结构的多网络激励深度强化学习方法(multiple incentive actor-critic,MIAC),作为自动发电控制的控制策略。考虑控制过程中的优化目标决策,通过AC策略的激励式启发更新机制,提高策略挖掘质量和经验探索效率,同时采用一种相对最小化Q值函数价值的更新方式以降低寻优偏差,引导策略目标趋向探索和利用的均衡,进而获取自动发电控制的最优协同控制。通过对改进的IEEE标准两区域电力系统模型和综合能源系统模型进行仿真,结果表明,所提MIAC策略具有良好的动态控制性能和迁移泛化能力,能实现对复杂电网强扰动环境的快速适应和稳定优化,能有效解决综合能源系统背景下的随机扰动问题。

全文