摘要
无人机应用中需要在非净空环境中实现自主安全飞行,其中障碍物存在部分已知,部分未知的特点,需在基于已知障碍物进行全局路径规划的同时,开展针对未知障碍物的自主避障。为实现障碍物半已知环境下的安全飞行,提出基于分层深度强化学习的混合路径规划方法。该方法将自主感知避障和全局路径规划后趋向航迹点飞行两个无人机自主飞行中需要执行的子任务,利用分层模型有机结合,实现功能的有效复合。分层深度强化学习模型中,避障和导航两个子任务模型可分别单独训练,并通过两个训练后的模型对系统状态进行抽象,在此基础上训练顶层模型,实现对两个任务输出的有效调度。试验表明,所提出的分层深度强化学习方法,可在全局路径规划后趋向航迹点飞行和自主感知避障的子任务控制器基础上,实现功能扩展完成更为复杂的任务,可在降低模型训练难度的同时,保持了模型任务执行能力。
- 单位