摘要

针对无人机(Unmanned Aerial Vehicle, UAV)搭载移动边缘服务器为地面用户进行服务时的服务质量(Quality of Service, QoS)问题,提出了一种基于深度强化学习的优化方案,旨在优化UAV飞行轨迹和卸载方案以最大化UAV为用户服务时的QoS。首先,定义了任务延迟来表征任务新鲜度,在任务延迟的基础上提出了一种新的QoS评价指标;其次,将最大化QoS问题建模为一个无转移概率的马尔可夫决策过程,并定义了该过程的状态空间、动作空间和奖励函数;最后,UAV通过所提出的算法进行训练,优化任务卸载方案并寻找最优飞行轨迹为地面用户进行服务以提高QoS。仿真结果表明所提算法较于其他算法能有效提高UAV为地面用户服务过程中的QoS且提高任务新鲜度。