近年来,人工智能发展迅速。深度强化学习结合了深度学习的感知能力以及强化学习的决策能力,在处理运动控制问题上,表现出非凡的潜力。本文首先介绍了传统的一些机械臂的运动规划算法,以及深度强化学习的算法。介绍了比较具有代表性的针对于连续运动问题的五种典型的深度强化学习算法,并选取二连杆这一经典的连续运动控制任务设计仿真实验,对比了算法性能,探索了将深度强化学习应用在实际的工业生产中的可能性。