基于情景记忆的无人机控制决策方法

作者:罗杰豪; 方敏; 谢佳晨; 史令安; 王鹏; 王宏博
来源:2022-05-25, 中国, CN202210577604.7.

摘要

本发明提出了一种基于情景记忆的无人机控制决策方法,实现步骤为:构建无人机控制场景;获取各个无人机的观测信息;构建深度强化学习模型H并进行初始化;构建情节记忆探索表;对深度强化学习模型H迭代训练;使用训练后的深度强化学习模型H对无人机行为进行自主控制。本发明使用多智能体分布式情节记忆探索表存储智能体过去相似经历的最优回报,并在智能体实际的探索过程中采用随机动作和情节记忆探索表中最优探索动作组合的形式进行动作选取,提高无人机控制任务的完成率和深度强化学习算法的收敛时间。