摘要

随着我国航天技术的快速发展,包括导航、遥感和通信在内的航天资源越来越丰富,同时,国民经济和国防建设对航天信息的需求迫切,如何充分地应用航天信息和航天资源,成为一个新的研究内容。分析了航天信息应用的具体模式,采用深度强化学习的建模和优化方法,探索和研究了具体应用场景下的深度强化学习对应用需求的筹划和决策安排,从而在理论上验证了将人工智能方法应用于航天信息综合应用决策的可行性,为航天信息应用的大众化、平民化提供了支撑。通过仿真环境,测试在有限迭代范围内多个模型的优化速度。实验证明,在价值模型中选择Double DQN网络,其优化决策的收敛性能更好。

  • 单位
    中国电子科技集团公司