摘要

通过引入一种启发式学习算法,部分改进了MAXQ递阶强化学习方法,并结合模糊神经网络开发了一种自主式地面车辆(ALV)全局路径规划Agent。该智能Agent充分融合了人类操作经验和机器学习能力,为强化学习明确了搜索方向,缩减了计算量,具有较强的自适应能力,满足了系统的实时性要求。仿真结果表明:在庞大状态空间和动态变化环境中,全局路径规划Agent能够有效、实时地进行最优行为的策略学习。