摘要
设备到设备(D2D)通信能够以蜂窝设施为基础来提高资源利用率、用户吞吐量和节省电池能量。在D2D网络中,模式选择和资源分配是关键问题。为了提高D2D通信的和速率与频谱利用效率,提出一种联合模式选择、功率和资源块分配的方案。首先根据用户地理位置选定模式选择标准,帮助用户选择相应的通信模式;然后针对复用通信模式,使用基于深度强化学习的异步优势动作评价(A3C)算法为不同的D2D用户分配资源块和功率。仿真结果表明,本文提出的基于A3C算法的联合优化方案收敛速度快,并且性能相对于其他算法较好。
- 单位