摘要

本发明公开了一种基于深度强化学习和方向估计的视觉导航方法,包括步骤:1)生成AI2-THOR仿真平台离线数据集;2)对离线数据集的RGB-D图像,提取图像特征;3)构建A3C深度强化学习模型,并将步骤2)中的特征作为模型的输入,进行模型的训练;4)根据现实场景对步骤3)训练好的模型进行迁移,并对其进行微调,提升其泛化能力,最后将微调好的模型应用到该现实场景的视觉导航中。本发明使用三维几何方法,通过方向估计方法计算导航到目标物体的位置和方向,为深度强化学习模型提供方向特征,使模型能够更快收敛并且泛化能力更强,实现精准的视觉导航。