摘要
针对agent路径规划算法收敛速度慢和规划效率低的缺点,提出了一种基于自适应动态规划和蚁群算法的agent路径规划算法.首先,利用agent获取的各距离传感器和目标传感器数据来获得系统状态的输入和输出;然后,提出了一种基于蚁群算法的路径各位置信息素更新方法,并用算法收敛后的信息素来初始化值函数;基于初始化的值函数,提出采用自适应的动态规划算法即Q学习算法来更新值函数,实现状态到动作的最优策略.最后,对基于自适应动态规划算法和蚁群算法的agent路径规划算法分别进行了定义和描述.在MATLAB环境下对所提的方法进行了仿真实验,实验结果表明:在固定障碍物和随机障碍物分布两种情况下所提方法均能收敛,而且分别仅需18个和25个时间步就能达到目标,较其它方法具有更高的收敛精度.
-
单位山西财经大学