规则约束下基于深度强化学习的船舶避碰方法

作者:周双林; 杨星; 刘克中*; 熊勇; 吴晓烈; 刘炯炯; 王伟强
来源:上海船舶运输科学研究所学报, 2020, 43(03): 27-46.

摘要

为减少因人为操作不当导致的船舶避碰事故,提高船舶航行的安全性,提出一种基于深度Q网络(Deep Q Network, DQN)强化学习方法的船舶智能避碰算法。依据船舶间实时获取的航行状态信息,从全局角度构建智能避碰算法深度强化学习状态集;在对《国际海上避碰规则》(International Regulations for Preventing Collisions at Sea,COLREGs)进行充分理解的基础上合理量化部分COLREGs,综合考虑航向跟随、船舶碰撞和规则符合等因素,设计船舶智能避碰DQN算法奖励函数,保证避碰决策安全有效且满足避碰规则的要求。分别针对两船和多船会遇场景进行仿真试验,结果表明:该方法可使船舶在COLREGs的要求下有效避让来船,为船舶智能避碰技术的研究提供参考。