摘要
针对自主水下机器人AUV(Autonomous Underwater Vehicle)的水下角度控制问题,提出一种基于深度确定性策略梯度DDPG(Deep Deterministic Policy Gradient)的水下控制方法,采用熵正则化的方式改进DDPG算法的训练效果。仿真结果表明,改进后的DDPG算法在水下角度的控制方面相较于未改进的DDPG算法具有更快速、更稳定的控制效果,可以有效的提高AUV的水下角度控制性能,同时也具有较强的鲁棒性。
-
单位石家庄铁道大学; 电子工程学院