摘要

针对传统物资调度算法因受动态电力信息的影响而存在的调度时间不精准的问题,该研究基于强化学习设计了新的电力系统应急物资调度算法。将电力系统状态集合、行为集合、报酬函数、平均性能指标和行为值函数作为性能指标,构建强化学习调度模型。基于该模型,分析电力应急物资运输路径,并计算物资满意度和时间满意度,从而设计电力系统应急物资调度算法。仿真实验结果表明,该算法的应急物资调度时间与期望时间一致,证明该算法能够为保障电力系统稳定运行提供有效的技术支持。