为满足时延敏感型业务的需求,同时解决工业互联网设备能耗受限、边缘服务器资源有限等问题,将时延和能耗作为优化目标,采用改进的深度强化学习算法进行工业互联网场景的资源分配。进一步,通过两个不同参数的神经网络互相监督,解决传统深度学习算法单一神经网络的估计值偏大问题,获得更优结果。仿真结果表明,与全卸载计算、全本地计算、随机卸载计算和传统Q学习算法相比,所提策略在分别改变终端数量、服务器计算能力、任务数据量时,均能得到更优性能。