摘要
为了提高电网运行运行性,设计了一个用于优化电网运行和维护管理的强化学习框架。以强化学习算法构建环境的随机行为模型,利用网格组件的运行状态信息进行预测与学习,可在不确定性环境下分析最大化预期利润的最优决策行为,以人工神经网络(artificial neural network, ANN)工具代替状态-行为值函数的表格,设计了非表格强化学习算法提高强化学习算法的适用能力。测试结果表明,强化学习算法可以收敛到最优策略,且响应时间更短,更能适应不确定性环境。因此,以人工神经网络替代状态-行为值函数表格形成的强化学习算法,可以有效解决电网运行维护的不确定性问题。