智能蓝军作战行为决策模型优化技术研究

免费注册

科研之友

微信

新浪微博

Facebook

作者：章乐贵; 曹雷; 陈希亮; 汤伟; 王军; 张启阳

来源：火力与指挥控制, 2023, 48(11): 17-24.

摘要

针对蓝军模型适应性和学习能力不足等问题，提出一种融合决策树和PPO强化学习的智能蓝军作战行为决策优化技术，在决策树运行过程中若智能体陷入决策困境，利用基于PPO算法训练的网络模型生成最优动作，确保其得以继续顺利高效执行，最后基于庙算·智胜平台开展对比实验，对优化技术进行了可行性和有效性验证。

更新时间：2024-03-15 17:53

科研之友科研之友机构版科创云

科研成果科研人员科研机构

帮助中心隐私政策服务条款

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号