摘要

针对快速搜索随机树(rapidly-exploring random tree,RRT)路径规划算法存在的随机性大、搜索效率低等问题,结合强化学习可根据先验知识选择策略的特点,提出了一种基于深度Q网络(deep Q-network,DQN)的改进RRT优化算法。首先设计复数域变步长的避障策略,并建立RRT算法中随机树生长的马尔科夫决策过程(Markov decision process,MDP)模型;然后将避障策略和MDP模型接入RRT-Connect算法的接口,并设计训练和路径规划的具体流程;最后在MATLAB软件平台上进行仿真实验。仿真结果表明,改进后的基于深度Q网络的RRTConnect算法(DQN-RRT-C)在快速性和搜索效率上有显著提高。

全文