摘要

近年来,国家电网积极推动泛在电力物联网的建设,以实现电力系统的万物互联与优化管理。其中,射频识别技术(RFID)作为泛在电力物联网建设的核心技术,凭其价格低廉、无需电源、非视距通信、远距离通信等特点,被广泛应用于电力仓储物资管理、电力巡检等应用场景。为了盘点电力设备仓库中的物品,需要快速识别粘贴在物品上的标签,然而由于仓库中存在大量标签,在通信过程中容易产生标签信号冲突。针对当前商用RFID系统普遍采用的符合EPC C1G2标准的动态帧时隙ALOHA协议,提出了一种新型的基于Q-learning与神经网络的帧长优化算法(记作QN-learning)。通过将动态帧长选择问题转化为马尔可夫决策过程(MDP),即观察到的状态为不同种类时隙的个数(空时隙数、单时隙数、冲突时隙数),执行的动作为设置合理的帧长,从而利用Q-learning与神经网络来自主学习帧长选择策略,基于学习到的策略可以指导系统根据最新观察选择能够实现全局最优的帧长。仿真实验结果表明,基于QN-learning算法在动态调整帧长方面表现优异,能够实现标签的有效识别,在保障高吞吐率的同时控制阅读器的询问次数,减少数据传输量。

  • 单位
    全球能源互联网研究院; 南京大学; 国网福建省电力有限公司电力科学研究院; 计算机软件新技术国家重点实验室