摘要

现有的立体匹配算法在弱纹理、阴影等病态区域匹配效果较差,为了充分利用场景上下文信息来提高视差匹配精度,本文提出一种有效的多重注意力立体匹配算法MAnet(Multi Attention Net)。特征提取阶段通过多种注意力机制,即位置通道注意力和多头十字交叉注意力(Multi-Heads Criss-Cross Attention,MCA),调整特征通道并有选择性地聚合任意范围内的上下文信息,为匹配代价计算提供更有辨识性的特征。通过将MCA扩展到3D卷积中,扩大网络感受野以聚合更准确的匹配代价。对于网络的损失函数,通过加权超过误差阈值部分的损失来提高困难区域的学习能力。本文在KITTI数据集中进行实验验证,KITTI2015测试集误差仅为2.06%,实验结果表明与基准算法相比,本文算法提高了视差精度,有助于改善病态区域的匹配效果。