摘要

针对隧道巡检机器人的应用需求,普通RGB相机只能得到二维图像信息,无法有效获取深度信息以及被遮挡的障碍物位置信息。因此无法有效引导机械臂避开障碍物。通过图像和机械臂末端反馈力构建综合环境感知系统,设计奖惩函数作为无模型强化学习算法的环境信息,引导机械臂避开障碍达到目标点。最后实验验证了此方法的有效性。