摘要

在认知无线电网络中,对于Underlay接入方式的功率控制问题,现有基于强化学习的方法存在次用户接入信道的成功率和吞吐量较低。针对这一问题,提出了一种基于A3C的功率控制算法。仿真结果表明,所提基于A3C的功率控制算法比现有基于DQN的功率控制算法有效地提高了次用户接入信道的成功率和吞吐量。为了进一步优化次用户的吞吐量,将次用户功率选择空间连续化。仿真结果表明,在连续功率场景下,所提基于A3C的功率控制算法可以进一步提高次用户的吞吐量。