采用DDPG的联合波束成形和功率控制算法

作者:李中捷; 高伟*; 熊吉源*; 李江虹*
来源:西安电子科技大学学报, 2022, 49(04): 39-48.
DOI:10.19665/j.issn1001-2400.2022.04.006

摘要

针对现有波束成形算法性能,大程度依赖信道状态信息质量而不适用于快速变化的实际系统和忽略功率控制问题,导致用户间干扰严重,从而降低通信链路频谱效率的问题,提出了基于深度强化学习的联合波束成形和功率控制算法,在无须完整信道状态信息的情况下对波束成形矩阵和功率控制问题进行联合求解。同时提出信息交互协议利于基站了解环境信息,并设计集中式训练分布式执行结构的双模型系统对联合优化问题进行求解。首先基站收集本地样本并上传至云端,云端接受基站上传的本地样本后,采用深度Q学习对波束成形进行设计;然后用深度确定性策略梯度算法取代深度Q学习求解功率控制问题,从而解决深度Q学习不适用于连续变量的问题。云端模型训练完成后,广播给所有基站进行分布式执行获取本地样本。仿真结果表明,在多用户通信环境中该算法的频谱效率优于传统波束成形算法和基于深度Q学习的联合波束成形和功率控制算法,从而验证了该算法的有效性。

全文