摘要
本发明公开了一种基于自注意力机制的多尺度特征光流学习计算方法,首先选择输入图像序列中的任意连续两帧图像,对选择的上述两帧图像进行金字塔特征提取,并求解序列初始光流场。其次对初始光流场和其对应特征进行特征融合,通过叠加融合特征与其对应的金字塔每层特征,并利用自注意力机制分别捕捉注意力依赖关系;进行通道层面的叠加后,进行特征提取计算求解残差光流场;从而进一步提高模型在大位移运动状态下图像边界或运动边缘处的光流计算精度。改善了图像序列光流计算中因大位移运动产生的边界模糊现象,对于复杂场景和大位移图像序列具有更高的计算精度和更好的适用性。
- 单位