摘要

利用无线能量传输(Wireless Power Transfer,WPT)向移动边缘计算(Mobile Edge Computing,MEC)系统中的用户设备供电以进一步提高系统的能效和计算可持续性是未来潜在的研究方向。提出了一种新的基于双阶段的深度Q网络(Deep Q-Network,DQN)优化框架。该框架求解了长期优化问题的同时也减小了强化学习的动作空间,提升了策略性能。通过大量仿真验证,提出的双阶段DQN方案具有更快的收敛速度,并且能实现接近60%的MEC系统能耗降低。