摘要
在工业无线传感器网络中,实时交付工业现场的周期性控制/传感数据流与非周期性事件数据流,是保障生产安全高效运行的关键。信息年龄(AoI)作为一种新兴的数据新鲜度衡量指标,能够从目标节点角度全面地度量网络数据交付的实时性。针对周期性和非周期性数据混合的工业无线传感器网络,该文在引入网络数据整体新鲜度指标的同时,考虑到周期性数据新鲜度在超过阈值后可能会对工业生产造成负面影响,建立了最小化系统平均AoI和周期性数据AoI逾期概率的联合优化模型,并将优化问题表述为马尔科夫决策过程进行求解。由于传统基于相对值迭代的最优求解方法在大规模网络中因为维度灾难难以实施,因此采用深度强化学习降低优化问题的状态空间维度,并改进决策探索机制以加快学习速度,提出了基于优化决策探索的深度强化学习调度方法。仿真结果表明,所提方法能够提高网络数据交付的实时性,并有效减少周期性数据的AoI逾期概率。
-
单位通信与信息工程学院; 重庆邮电大学