摘要
本发明涉及雷击防控和配电网保护技术领域,尤其是一种基于深度强化学习的线路重合调度策略模型、方法和系统。本发明主要是通过将具有影响雷击后线路状况的特征耦合关系信息与线路中电器之间的拓扑关系信息耦合输入到Actor-Critic网络中,对Actor-Critic网络模型训练直至获取到收敛的最佳重合闸调度策略。本发明考虑线路中不同电器的电阻有所差异将线路中电器节点划分到若干区域,可使得电器电阻对线路雷击跳闸后是否采取正确动作的影响降低,从而提高线路重合调度决策的正确性,减少了调度失败的概率。
- 单位