摘要

可重构智能表面(Reconfigurable Intelligent Surface, RIS)技术是一种新兴的、绿色的技术,可以有效地实现频谱和能量的高效无线通信。本文研究基站(Base Stations, BSs)与RIS的联合波束形成中总发射功率最小化问题。由于人工智能 (Artificial Intelligence,AI)在处理高维数据问题和非凸模型方面的优势,本文基于深度强化学习(Deep Reinforcement Learning, DRL)中的双延迟深度确定性策略梯度算法(Twin Delayed Deep Deterministic policy gradient, TD3),设计一种新颖的联合波束成形算法来处理RIS辅助无线通信系统的基站总发射功率最小化问题。仿真结果表明,本文所提算法的性能优于经典的交替优化算法,并且通过本文所提算法训练得到的模型可以直接部署和调用,不需要再次重复计算。