基于深度强化学习的无人战车自主行为决策

张耀; 武富春; 王明<sup>*</sup>; 段宏; 张昭; 王海龙

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于深度强化学习的无人战车自主行为决策

作者：张耀; 武富春; 王明^*; 段宏; 张昭; 王海龙

来源：火力与指挥控制, 2021, 46(04): 72-77.

摘要

针对高动态强对抗战场环境下,无人战车面临的自主行为决策问题,分析了未来陆战场无人战车实际作战需求,构建了基于马尔可夫决策过程的自主行为决策模型,提出了一种深度强化学习结合行为树的方法,利用行为树的逻辑规则与先验知识降低强化学习问题的难度,保证收敛性和鲁棒性,同时使行为决策模型具有学习能力。构建典型作战场景,验证深度强化学习结合行为树的无人战车自主行为决策方法的有效性。

单位
北方自动控制技术研究所

收藏分享被引(4) 浏览

更新时间：2024-04-17 13:16

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号