摘要

在移动边缘计算(MEC)与星地协同网络(STIN)融合的网络架构中,针对卫星网络和边缘计算对时延与资源敏感的特点,以最大化用户服务质量(QoS)为目标,提出基于强化学习的深度Q网络(DQN)算法部署机制。将部署问题描述为一个马尔可夫决策过程(MDP),并把卫星节点的状态和部署行为分别建模为DQN中的状态和动作。通过卫星的计算资源与卫星和用户的通信时延给出奖励值,在神经网络中训练以优化部署行为,进而实现最优部署策略,并对提出的算法做仿真。与其他算法对比的结果表明,在相同的优化目标条件下,DQN算法有较好的性能。