研究了编队防空目标分配问题,采用马尔科夫决策模型描述了编队防空动态目标分配过程,构建了编队防空目标分配强化学习系统,描述了系统组成,给出了基于Q-Learning算法的模型求解方法,并对模型效果进行了仿真分析,证明了该模型的有效性。