摘要

针对传统控制算法在复杂环境下,精度低、稳定性不足等问题,提出了一种基于深度确定策略梯度算法(deep deterministic policy gradient, DDPG)的控制算法,以更好地解决6轴机械臂在三维空间中的控制难题。在MuJoCo平台上建立仿真环境,引入所设计机械臂为测试对象,并采用DDPG算法、柔性动作-评估算法(soft actor-critic algorithms, SAC)和双延迟深度确定策略梯度算法(twin delayed deep deterministic policy gradient, TD3)对仿真环境下的机械臂进行了几组对比测试。研究表明:以DDPG算法为基础的机械臂控制方法能够有效地提高机械臂的控制精度,相对于SAC、TD3等算法稳定性较好。