摘要

物联网时代需要实现海量的节点覆盖和连接,对于一些偏远地区,物联网通信技术存在无法及时采集数据的问题。而无人机具有灵活性和机动性等特点,因此,可用于物联网中的无线传感器网络的数据采集。所提方案着重对无人机辅助传感器网络数据采集时的路径规划问题进行了研究,同时满足无人机自身因电池容量有限而产生的充电需求。具体地,利用时间抽象分层强化学习思想,基于离散动作深度强化学习架构,提出了一种新颖的option-DQN(option-deepQ-learning)算法,实现了高效的无人机数据采集和路径规划,同时控制无人机及时进行充电,保证其正常飞行。仿真结果表明,相比于传统DQN(deep Q-learning)算法,所提算法在训练时的周期奖励上升速度更快,最终达到的周期奖励水平更高,并且无人机在执行任务时的轨迹更清晰、合理,所提算法可以判断无人机何时应进行充电,从而保证无人机的电量始终充足。