摘要
针对有限信道状态信息下密集型网络资源分配的问题,提出将交替方向乘子法与深度强化学习算法相结合的模型驱动学习框架。区别于数据驱动框架,利用所提框架能够根据具体问题进行一对一建模。建模内容包括基站选择、功率和子载波分配,并用交替方向乘子法进行交替优化;用深度强化学习算法优化权重,求解目标函数,提高了算法的性能;利用有效信道状态信息而非多余信息,降低了通信开销;加强对最低用户服务质量的要求,在保证用户具有良好体验的情况下使小区的频谱效率最大化。仿真结果表明,在较少的迭代次数下,利用所提框架可使小区用户的频谱效率收敛,达到最大值。
-
单位通信与信息工程学院; 南京邮电大学