摘要

研究了处于瑞利衰落信道下,具有一个固定能量源的能量收集系统对能量传输进行调度的问题.根据信道信息和电池的剩余电量状态,确定电池的充电时长使得能量传输过程中能量源的能量消耗、电池的耗尽次数以及电池电量溢出的次数尽可能最小.接着再使用加权和的方式来表示该优化问题.利用Q学习的思想,提出了一种基于Q学习的能量调度方案来解决此问题.通过将基于Q学习的能量传输调度方案与2种离线传输策略(静态策略和按需分配的动态策略)在能量消耗、电池电量耗尽次数以及电池电量溢出等方面进行比较,分析该算法的优势与不足.仿真结果表明,基于Q学习的能量传输调度方案有效地抑制了电池电量耗尽和电池电量溢出的发生,从而提高了系统的稳定性.