摘要
随着无人机数量的增长,无人机间飞行冲突的自动解脱研究成为热点。针对冲突无人机数量变化的多机冲突解脱问题,采用一个集中式的深度多智能体强化学习算法——BiCNet算法。BiCNet算法包含参数共享机制和双向循环神经网络,使得冲突解脱模型可以支持动态扩展,即能够使用不同数量UAV的多机冲突场景进行训练,并理论上可以解脱任意数量冲突无人机的多机冲突,进而提高冲突解脱模型的训练效率。此外,基于微软面向无人机的开源仿真环境AirSim,设计了大量高密度的无人机多机冲突场景,并对冲突解脱模型进行了训练和测试。从实验的结果来看,训练曲线和测试结果表明解脱模型在求解时间和解脱率方面有很好的表现。
-
单位南京航空航天大学; 中国民用航空局