摘要
针对航母甲板上舰载机混合避障随机性强、实时性差、规划速度慢等问题,结合最小二乘法与DDPG(deep deterministic policy gradient)算法提出一种PDDPG(predictive depth deterministic policy gradient)算法。该方法利用最小二乘法预测航母甲板上动态障碍物的短期轨迹。DDPG根据动态障碍物的短期轨迹为智能体提供在连续空间里学习和决策行为的能力。基于人工势场设置奖励函数,提高混合避障算法的收敛速度和准确率。使用Unity 3D构建了航母甲板高动态复杂场景,进行舰载机混合避障仿真实验。实验结果表明,PDDPG能较准确地实现航母甲板上舰载机的混合避障,与其他方法相比,在精度上提高了7%~30%。与DQN(deep Q network)相比,路径长度和转弯角度上分别减少了100个单位和400o~450o。
- 单位