摘要

随着新能源并网规模不断扩大,能源形式更加灵活多变,电力系统调度运行面临新的挑战。随着系统复杂度和不确定性增加,传统基于物理模型的优化方法难以建立精确的模型进行实时快速求解,而深度强化学习(DRL)可以从历史经验中自适应地学习调度策略并实时决策,避免了复杂的建模过程,以数据驱动的方式应对更高的不确定性和复杂度。文中首先介绍了新型电力系统调度运行问题;然后,介绍了DRL原理及其分类算法;接着,分析了各类DRL算法在求解新型电力系统调度决策问题时的优势与劣势;最后,对需进一步研究的方向进行了展望。