摘要
针对空间机械臂在轨捕获问题,提出了一种基于深度强化学习原理的柔顺捕获控制方法,采用深度确定性策略梯度算法设计了控制器.在仿真环境中使用6自由度机械臂对特定质量、初始速度的目标进行了大量抓捕训练,使得控制器能够根据机械臂状态输出合适的力矩,促使目标运动速度最终趋近于0并能够有效降低交互过程中的冲击力.同时,对于不同质量和初始速度的目标,该控制器同样具备良好的适应性并可实现柔顺捕获.与传统基于阻抗控制原理的柔顺控制方法相比,该方法能够减小碰撞过程的最大冲击力,实现不依赖模型的柔顺控制,经工程化改进后有望应用于空间智能捕获任务中.
- 单位