摘要

低轨遥感星座任务规划是一个复杂的多目标优化问题,目前基于深度强化学习的卫星任务规划研究存在试验数据星座规模小、优化目标单一、任务重复安排或模型适应性差等问题.针对上述问题,提出CON_DQN(Contract network and Deep Q Network)算法,采用主从星在轨分布式协商机制,从星基于规划决策,主星基于深度强化学习算法决策,从任务优先级、资源代价和负载均衡等方面进行多目标优化,实现面向即时响应的卫星在轨分布式协商智能任务规划.针对用户需求高频动态到达重点观测区域的场景,进行百星级星座不同规模任务集的仿真实验,结果表明本文所提算法的响应速度较快且能达到较高的任务收益.

全文