摘要

针对机器对机器(machine-to-machine,M2M)通信在加强的长期演进(long term evolution-advanced, LTE-A)网络上行链路能量效率问题,文章提出了一种基于强化学习的M2M通信上行链路节能优化算法。首先建立M2M通信能量效率模型,并将其重构为二维背包问题;然后使用强化学习的方法,引进并训练指针网络模型;最后通过主动搜索的策略解决该背包问题。仿真结果表明,相比于经典算法,当设备规模很大时,该算法性能更优,保证设备服务质量(quality of service, QoS)需求和公平性的同时,优化系统能效并降低数据的丢包率。