摘要
针对可重构智能表面(reconfigurable intelligent surface, RIS)辅助的安全无线通信系统在保密率优化问题中存在的信道空间连续变化、传统数学优化方法难以逼近最优解等问题,提出一种基于深度强化学习的SEC-DDPG(security deep deterministic policy gradient)算法。通过将RIS通信系统建模为连续变化空间中的马尔可夫决策过程,联合优化传输波束赋形和反射波束赋形达到最大化用户保密率的目的。仿真实验结果显示,在不同的传输功率及反射单元数量下,SEC-DDPG算法在主动和被动RIS系统中得到的最优保密率均比传统的交替优化算法有15%~20%的提升。研究结果表明,主动RIS场景下的安全性要优于被动RIS,与交替优化算法相比,SEC-DDPG算法能显著提高安全无线通信系统的用户保密率且具有鲁棒性,接近系统的最佳保密性能。
- 单位