摘要
传统的视觉里程计(Visual Odometry, VO)要求图片含有大量的纹理信息,且求解过程较为复杂。针对以上问题提出基于注意力卷积神经网络的视觉里程计,对相机进行端到端的位姿估计,利用注意力机制提高模型估计轨迹的精度。首先使用注意力-卷积神经网络(Convolutional Neural Networks, CNN)模块提取图像特征,然后将特征输入到门控循环单元(Gated Recurrent Unit, GRU)学习图像的时序连接性,最后通过全连接层降维输出相机位姿。在KITTI数据集上完成实验,并与其他方法进行对比,结果表明卷积网络中加入注意力机制可以有效提高估计轨迹精度,且误差低于其他视觉里程计算法。
- 单位