基于情景记忆的无人机控制决策方法

罗杰豪; 方敏; 谢佳晨; 史令安; 王鹏; 王宏博

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于情景记忆的无人机控制决策方法

作者：罗杰豪; 方敏; 谢佳晨; 史令安; 王鹏; 王宏博

来源：2022-05-25, 中国, CN202210577604.7.

摘要

本发明提出了一种基于情景记忆的无人机控制决策方法,实现步骤为：构建无人机控制场景；获取各个无人机的观测信息；构建深度强化学习模型H并进行初始化；构建情节记忆探索表；对深度强化学习模型H迭代训练；使用训练后的深度强化学习模型H对无人机行为进行自主控制。本发明使用多智能体分布式情节记忆探索表存储智能体过去相似经历的最优回报,并在智能体实际的探索过程中采用随机动作和情节记忆探索表中最优探索动作组合的形式进行动作选取,提高无人机控制任务的完成率和深度强化学习算法的收敛时间。

单位
西安电子科技大学

收藏分享被引浏览

更新时间：2024-09-23 21:40

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号