一种基于DDPG算法的6轴机械臂控制研究

何联格; 李天华; 聂远航; 妥吉英<sup>*</sup>

摘要

针对传统控制算法在复杂环境下，精度低、稳定性不足等问题，提出了一种基于深度确定策略梯度算法(deep deterministic policy gradient, DDPG)的控制算法，以更好地解决6轴机械臂在三维空间中的控制难题。在MuJoCo平台上建立仿真环境，引入所设计机械臂为测试对象，并采用DDPG算法、柔性动作-评估算法(soft actor-critic algorithms, SAC)和双延迟深度确定策略梯度算法(twin delayed deep deterministic policy gradient, TD3)对仿真环境下的机械臂进行了几组对比测试。研究表明：以DDPG算法为基础的机械臂控制方法能够有效地提高机械臂的控制精度，相对于SAC、TD3等算法稳定性较好。

单位
北京信息科技大学; 重庆理工大学

收藏分享被引浏览

更新时间：2024-03-19 04:10

一种基于DDPG算法的6轴机械臂控制研究

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友