摘要

针对同一场景中多组图像匹配精度低,以及不同场景中图像匹配鲁棒性差等问题,提出一种基于深度学习的端到端图像匹配方法。本文基于LoFTR改进,在融合ResNet和FPN的特征提取网络中,减少其激活函数,并加入CBAM注意力模块,后续通过Transfromer生成特征图,进行图像匹配。结果表明,改进网络结构后的方法具有更好的匹配精度以及鲁棒性,在公开数据集Megadepth的子集上进行训练和测试,平均匹配精度达到93.68%,相较于LoFTR提升了1.33%,在阈值为5°、10°、20°情况下姿态误差的AUC数值均有提升;在TUM数据集子集上验证,其平均匹配精度提高了2.13%。

全文