摘要

针对分布式电源优化调度面临的隐私保护和实时决策问题,提出了基于联邦强化学习的多智能体分布式协同优化策略。首先,构建了基于联邦强化学习的配电网分布式协同优化框架,利用联邦学习避免在多智能体深度强化学习过程中泄露隐私数据。在此框架下,提出了多智能体约束策略优化方法,利用离线训练缩短在线决策时间,支持智能体实时分布式决策。同时,该方法为智能体构建了考虑潮流方程等约束条件的可行域,允许智能体在训练过程中自由探索,提高了收敛速度,并确保实时调度策略满足电力系统安全运行约束。最后,通过算例进行仿真验证,结果表明离线训练时各智能体仅利用局部信息即可实现全局优化,并保证了实时决策和调度策略的安全性。

  • 单位
    中国电力科学研究院有限公司