摘要
智能行为决策系统的基本要素在于模糊性、动态性和学习能力。移动机器人尤其是无人车辆、无人飞行器等的运行环境存在复杂性、未知与高动态性,且精确动力学建模难度大,而特定模型参数的变化特征以及对速度和航向控制的人工经验具有可获取性,据此提出了一种基于强化学习方法暨模糊Q学习的多约束条件下自主导航控制算法研究,提高复杂环境下无人器具自主导航控制系统的自适应性和鲁棒性。采用非完整性约束移动机器人运动模型进行了仿真。仿真结果表明,算法具有可移植性与通用性,可应用于无人飞行器的躲避机动与拦截。
-
单位中国运载火箭技术研究院研究发展中心