摘要
目的针对应用在定制家具生产包装车间的板材搬运自动引导车存在的路径规划时间长以及规划出的路径转弯次数较多的问题,提出一种改进Q-learning算法的路径规划算法。方法根据定制家具生产包装车间环境情况,使用栅格法对车间进行建模,建立车间模型的人工标量场,使用人工标量场给予Q-learning算法前期搜索的目的性;增加Q-learning算法的学习层,使得算法可以更快进入收敛;在奖励函数中加入转弯惩罚,使得算法规划出的路径具有更少的转弯次数。结果仿真结果表明改进后的算法与标准Q-learning算法、增加学习层的Q-learning算法、引入人工势能场Q-learning算法、深度双Q网络算法相比,迭代次数减少了70.46%,64.40%,67.75%,30.49%,转弯次数减少了80%,80.95%,83.33%,73.33%。结论板材搬运自动引导车利用改进后的Q-learning算法可以有效地提高路径的平滑性,降低了路径规划的时间,提高了板材搬运自动引导车的工作效率。
-
单位东北林业大学; 机电工程学院