临时限速下基于强化学习的高速列车速度曲线优化

周敏; 董海荣<sup>*</sup>; 周学影; 许伟; 宁灵斌

摘要

高速列车运行过程中受到恶劣天气、前方列车等的影响，导致线路增设临时限速，需要实时生成优化的目标速度曲线，以保障运行效率。为此，提出考虑限速信息的列车目标速度曲线优化方法。根据列车运行阶段的不同设置工况调整策略，并提出用于优化列车车载控制器的动作选择策略的最短剩余运行时间计算方法。在高速列车运行强化学习环境的状态空间中增加限速信息变量，重构了强化学习环境。基于优先回放机制改进了双深度Q网络算法，以提高算法学习效率和模型收敛速度。不同临时限速场景下的仿真算例表明双深度Q网络算法可以充分利用计划运行时间曲线与最短运行时间曲线之间的冗余，保证列车准时性的前提下实现列车节能舒适运行，与遗传算法相比，有效减少工况切换次数，同时降低列车运行能耗3%以上。

单位
北京交通大学; 中国铁道科学研究院集团有限公司; 轨道交通控制与安全国家重点实验室

收藏分享被引浏览

更新时间：2024-03-19 02:36

临时限速下基于强化学习的高速列车速度曲线优化

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友