针对现有的路径规划算法效率低的问题,根据奖励函数和多层感知机提出一种基于深度强化学习的路径规划算法。考虑到环境的复杂程度,为了降低过拟合的概率,因此神经网络选择较优的动作,提出以多层感知机为基础的深度Q网络算法(Deep Q-learning Network, DQN)。为了得到动态的奖励值,该算法根据目标的相关信息改进奖励函数,根据动态的奖励值来区别不同动作的价值,从而提升神经网络动作选择的效率。实验结果表明,该算法能够用更少的探索步数使奖励值趋向平稳,并且找到较优路径。