基于多智能体强化学习的多无人机边缘计算任务卸载

李斌

摘要

研究了一种多无人机UAVs辅助移动边缘计算(Mobile Edge Computing, MEC)任务卸载方案，通过联合优化任务划分、卸载关联、无人机轨迹和资源分配，实现系统能耗最小化。由于计算任务生成的随机性和用户移动的不可预测性，该问题不仅是一个非凸整数规划问题，更是一个需要实时决策、长期考虑的目标优化问题，传统离线算法难以求解。提出一种基于多智能体强化学习(Multi-Agent Reinforcement Learning, MARL)的任务卸载方法，采用集中式训练-分布式执行架构，根据网络状态的观测做出实时决策。将问题建模为马尔科夫决策模型，基于多智能体近端策略优化算法进行训练，通过不断学习以优化自身策略。针对Actor网络，使用Beta分布改进其策略分布的采样，以适应有界的混合动作空间，引入注意力机制以提升状态值函数的拟合性能，加速算法收敛。仿真结果表明，相比基准方案，所提方法收敛速度提升了10%～30%,用户与无人机的加权能耗降低了22.5%～31.6%。

单位
南京信息工程大学

收藏分享被引浏览

更新时间：2024-03-15 19:01

基于多智能体强化学习的多无人机边缘计算任务卸载

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友