摘要

为了降低终端直通(device-to-device,D2D)通信网络数据传输能耗,提高用户服务质量,提出了基于强化学习的D2D通信网络低能耗路由算法。通过复用带宽作为约束,建立最小时延、丢包率的目标函数,提升D2D网络的用户服务质量需求,以节点准确接收数据包的概率、数据包的转发次数,构建数据传输最低能耗的目标函数,选择最佳中继节点实现D2D通信网络的低能耗传输;将D2D用户对视作一个智能Agent,利用马尔可夫决策过程描述D2D通信网络,采用Q-Learning算法实现多目标函数的求解,确定低能耗路由路径。实验结果表明:当权重系数为0.4时,可确保D2D通信网络丢包率、时延性均达到最优状态,提升节点数据包的准确接收概率、减少转发次数可有效降低D2D通信网络能耗,且具有突出效果。