基于深度强化学习的电-气区域综合能源系统 安全校正控制决策方法

彭寒梅; 胡磊; 谭貌; 李金果; 苏永新

doi:10.13335/j.1000-3673.pst.2023.0380

摘要

电-气区域综合能源系统电、气相互耦合与影响，使得其安全校正控制难度大且对快速性要求高，为此，提出一种基于深度确定性策略梯度(deep deterministic policy gradient，DDPG）深度强化学习的安全校正控制决策方法。首先，进行系统多能流与变量分析，建立安全校正控制的目标与约束条件。然后，构建基于DDPG的安全校正控制模型，设计目标奖励和各种约束条件奖励，提出结合基于综合灵敏度的安全校正知识经验设计目标奖励函数，使调整具有方向性，且目标奖励考虑能量枢纽(energy hub，EH)的经济效益及其可再生能源消纳；通过智能体离线训练，使其能够在线做出实时最优的安全校正控制策略，预先产生专家经验数据集存放于经验回放池，提高训练速度和收敛性。最后，通过含EH电-气区域综合能源系统仿真算例验证了所提方法的有效性。

单位
湘潭大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-01-09 08:13

基于深度强化学习的电-气区域综合能源系统安全校正控制决策方法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友