摘要

考虑到不同用户任务和计算能力差异,并综合低地球轨道(Low Earth Orbit, LEO)卫星移动和资源限制等因素,针对多颗LEO卫星覆盖场景下的多用户任务决策卸载问题,提出了一种基于深度强化学习(Deep Reinforcement Learning, DRL)的决策卸载和资源分配策略,对系统的耗时和能耗进行优化。决策卸载问题设置为一个离散的有效状态的单用户决策选择问题,采用深度强化学习进行求解。采用拉格朗日乘子法和梯度投影法处理资源分配问题。仿真结果表明,该策略在75次迭代回合后能达到收敛,与其他策略相比,系统成本下降约50%、34%和19%。

全文