摘要

光伏应用于直流牵引供电系统可提高新能源渗透率、降低系统能耗,但可再生能源出力不确定性及列车负荷强波动性增加了控制策略寻优难度。针对该问题提出一种基于深度强化学习的控制策略优化方法。该方法基于深度Q网络,将源储荷能量管理系统作为智能代理,通过光伏出力、储能荷电状态、牵引网压等外部状态训练代理,得到可实现系统经济可靠运行的优化策略。首先,介绍源储荷综合系统的框架结构及传统控制策略,并对各设备进行外特性建模;其次,对源储荷综合系统能量管理问题开展马尔可夫决策过程建模,确立强化学习框架;最后,根据某市域线路数据在Matlab平台进行仿真,验证所提策略。研究结果表明,所提方法通过动态调整储能电压阈值可实现控制策略优化,与几种传统控制策略对比可知,该方法在兼顾系统稳压水平与运行经济性方面占据优势,另在不同环境下对比收敛效果体现该方法的可继承性,在多组测试样本下验证该方法的普适性。

全文