现代作战态势愈加复杂,人工智能的跨越发展为提高军事决策智能化水平提供了新思路。利用深度强化学习技术,发挥深度网络在态势特征提取方面的能力,结合强化算法对智能体决策方法的迭代与优化,实现了作战智能化。针对复杂的作战态势,提出了一种对战训练框架,为执行辅助防空反导任务的歼击机构建智能体,并利用奖励重塑的方法缓解稀疏奖励问题,探讨了全面实现军事决策智能化的道路。