摘要

研究了一种多无人机UAVs辅助移动边缘计算(Mobile Edge Computing, MEC)任务卸载方案,通过联合优化任务划分、卸载关联、无人机轨迹和资源分配,实现系统能耗最小化。由于计算任务生成的随机性和用户移动的不可预测性,该问题不仅是一个非凸整数规划问题,更是一个需要实时决策、长期考虑的目标优化问题,传统离线算法难以求解。提出一种基于多智能体强化学习(Multi-Agent Reinforcement Learning, MARL)的任务卸载方法,采用集中式训练-分布式执行架构,根据网络状态的观测做出实时决策。将问题建模为马尔科夫决策模型,基于多智能体近端策略优化算法进行训练,通过不断学习以优化自身策略。针对Actor网络,使用Beta分布改进其策略分布的采样,以适应有界的混合动作空间,引入注意力机制以提升状态值函数的拟合性能,加速算法收敛。仿真结果表明,相比基准方案,所提方法收敛速度提升了10%~30%,用户与无人机的加权能耗降低了22.5%~31.6%。