摘要

针对现有多信道接入策略较难适应信道环境动态性问题,提出基于深度强化学习的多信道智能接入方法。首先,通过将多信道接入模型描述成马尔可夫决策过程,提出Q-learning方法以实现多信道的智能接入。在此基础上,针对Q-learning状态空间大和收敛慢等特点,通过设计深度神经网络,以获得近似最优的多信道智能接入策略。最后,通过搭建NS3仿真平台,以验证本文提出多信道智能接入方法的性能。仿真结果表明,提出的基于深度强化学习多信道智能接入方法,较之现有强化学习方法,能够在动态的多信道环境中,以较快收敛速度获得更优的接入性能。