基于LSTM优化DQN网络的多约束频谱分配方法

作者:齐佩汉; 郭昊; **洋; 张正宇; 孟永超; 李赞; 关磊; 周小雨; 李鹏飞
来源:2022-03-18, 中国, CN202210271164.2.

摘要

本发明公开了一种基于LSTM优化DQN网络的多约束频谱分配方法,在前处理阶段获取系统内各项设备参数指标与频段资源数据并计算各功能矩阵;初始化DQN网络并完成前期预处理结果与网络元素的映射;设置仿真阶段数episode并记为e,将网络的训练过程分为多个e;更新搜索概率p-t;在集中式分配的基础上采用局部分布方式依次对环境内设备D-i进行动作,即频段的选取工作,并最终汇总为整体动作a-t;整体网络迭代学习;收集并更新历史最优整体动作a-t,并将其作为最优的频谱分配方案输出,将依次为各设备分给具体频段资源。本发明在满足不同设备优先顺序的约束下,对允许资源复用的无模型随机环境内所有设备各项信息进行综合分析。