摘要
针对基于传统通信机制的高速飞行器集群控制策略鲁棒性低、所需通信量大的问题,提出一种基于深度强化学习框架的可自主调节通信数量的集群控制方法。其中,使用深度神经网络构建控制策略与通信策略耦合的集群控制策略,其输出包含控制飞行器运动的过载指令以及与邻近飞行器的通信数量。通过与任务环境的不断交互,训练出的集群控制策略能根据环境信息自主调整通信拓扑结构,保证集群控制的鲁棒性和较低的通信量。仿真结果表明,相比于集中式,分层式和分布式通信机制,所提的自适应通信机制可在较低的集群通信量下安全快速地控制飞行器集群到达目标点并且较好地保持编队队形。
-
单位航天学院; 哈尔滨工业大学; 北京航天自动控制研究所