摘要

为了能在异构网络中满足海量用户和新型业务的需求,提出了一种基于强化学习的用户接入策略.首先将用户的网络接入过程表征为离散时间的马尔可夫过程.然后,使用层次分析法和灰色关联分析来表征用户对网络的偏好.考虑不同类型网络之间网络接入策略的联合优化,以提高系统长期性能为目的提出了一种基于纳什Q学习的多智能体网络接入算法.实验结果表明,与现有的网络接入算法相比,本算法在系统吞吐量、用户阻塞概率和平均延迟方面具有更好的性能.