摘要
为了提高移动机械臂在狭窄通道和障碍物约束情况的避障轨迹规划能力,提出了一种人工势场法(APF)和深度确定性策略梯度算法(DDPG)结合的改进算法(APF-DDPG)。首先,对机械臂设计了APF规划得到近似姿态,再将研究问题表示为马尔科夫决策过程,设计了状态空间、动作空间和奖惩函数,对规划过程进行阶段性分析处理,设计了一种引导机制来过渡各控制阶段,即避障阶段由DDPG主导训练,目标规划阶段由近似姿态引导DDPG训练,最终获得用于规划的策略模型。最后,建立并设计了固定和随机状态场景的仿真实验验证了本算法的有效性。实验结果表明,APF-DDPG算法,相较于传统DDPG算法,能够以更高收敛效率训练得到具有更高效控制性能的策略模型。
- 单位