摘要

针对无人机路径规划中传统算法面对未知情况时适应程度低、在线求解效率低、计算量大等问题,基于深度强化学习DDPG算法,提出了一种无人机路径规划方法。采用策略网络和评价网络的双网络结构,拟合无人机路径规划决策函数和状态动作函数,根据状态空间、动作空间和网络结构设计了DDPG算法模型。通过仿真验证了所提出的路径规划方法的有效性。