摘要
本发明公开了一种基于强化学习的无人机集群分布式编队方法,步骤1):获取编队目标状态函数和环境不确定性因素仿真模型;构建无人机编队仿真模型;步骤2):在环境不确定性因素的干扰下,基于步骤1)构建的无人机编队仿真模型,采用Q学习方法对无人机集群进行训练来更新飞行策略表;步骤3):根据获取的编队目标状态函数计算编队目标状态完成度的值,并将所得编队目标状态完成度的值与预设的编队目标状态的值进行比较,根据比较结果判断是否达到编队目标状态,若达到编队目标状态,则执行步骤4),否则转至步骤2);步骤4):保存更新的飞行策略表。本发明为集群提供具有自适应性质的飞行策略参数,保障无人机集群编队的稳定性与鲁棒性。
- 单位