随着物联网的飞速发展,高速、海量的数据通信向服务质量保障机制提出了挑战。为了很好地满足用户对高效、低延迟路由的需求,文章结合软件定义网络(SDN)技术,提出一种软件定义物联网中基于深度强化学习的路由优化算法(RDIS)。RDIS利用控制器收集网络信息,基于改进的深度确定性策略梯度算法,在经验回放池中根据重要性对样本采样,最终获得一条性能近乎最优的路径。仿真实验表明,相较于传统的路由算法,RDIS在吞吐量和延迟方面具有更好的网络性能。