摘要
为提高无人作战飞机(UCAV)自主决策效能,提出基于逆强化学习的空战态势评估函数优化方法。以现有的正例与反例两类空战数据为样本训练一个RBF网络,采用逆强化学习得到不同态势下的态势值,实现了对现有空战数据的知识提取;利用Sigmoid函数的压缩作用,降低了整体态势值,加快了UCAV学习的收敛速度;采用自适应粒子群算法求解优化了态势评估函数中的权重参数,提升了对复杂空战态势的适应能力;仿真结果表明该方法能够优化态势评估函数,提高机动决策的收敛速度,在UCAV自主决策中具有一定现实意义。
-
单位空军工程大学