摘要

为了提升遮挡区域等视差估计精度,提出基于注意力机制网络的立体匹配算法(AMSN)。在特征提取网络部分,给残差网络中浅层分配更多的块数以获取细节信息,并用注意力模块分别从空间和通道维度捕获全局信息,使得提取的特征包含丰富的语境信息。在代价聚合模块采用3D卷积并利用编码解码结构进行多尺度的特征融合。其在SceneFlow数据集上的EPE和在KITTI数据集上的3像素误差指标均优于现有性能较好方法,实验结果证明了该方法在立体匹配上的有效性。