摘要

无人机辅助物联网数据采集是高效且具有前景的方法。本文针对路径规划的优化资源分配问题,细化了电量消耗模型,并考虑了三个指标:数据量、时间效率和能源效率。该问题被建模为分布式局部可观测马尔可夫决策过程,并提出一种深度强化学习算法。具体地,将归一化的模型分为四个具体地的无人机电量消耗模型;其次,基于离散动作离线深度强化学习架构,提出一种新的RISE(Rényi State Entropy)-D3QN(Dueling Double Deep Q Network)算法,结合了内在奖励、优先经验回放和soft-max探索策略,可在无人机电池容量、物联网设备位置、物联网设备数据量、物联网设备数量发生变化的同时规划无人机群的路径。仿真结果表明,相比于传统的D3QN算法以及传统的DQN算法,在确保无人机安全飞行的同时,提高了无人机从物联网设备采集的数据量,并在以此为主要目标的情况下减少了无人机的飞行时间以及能量消耗。