基于改进Q-learning算法和DWA的路径规划

作者:王志伟; 邹艳丽*; 刘唐慧美; 侯凤萍; 余自淳
来源:传感器与微系统, 2023, 42(09): 148-152.
DOI:10.13873/J.1000-9787(2023)09-0148-05

摘要

针对传统Q-learning算法出现的规划路线转折点多,探索效率低,以及无法实现动态环境下的路径规划问题,提出一种基于改进Q-learning算法和动态窗口法(DWA)的融合算法。首先,改变传统Q-learning算法的搜索方式,由原先的8方向变成16方向;利用模拟退火算法对Q-learning进行迭代优化;通过路径节点优化算法进行节点简化,提高路径平滑度。然后,提取改进Q-learning算法规划路径的节点,将其作为DWA算法的临时目标,前进过程中,能够实时躲避环境中出现的动静态障碍物。最终实验结果表明:融合算法具有较好的路径规划能力,实现了全局最优和有效避障的效果。

全文