摘要
人脸反欺骗是指判别捕获的人脸是真实人脸还是假人脸攻击,它可以有效保护人脸识别系统免受演示攻击,例如照片、面具、视频回放等。传统的人脸反欺骗方法主要是利用人工设计的特征,如LBP、HoG、SIFT、SURF和DoG来刻画真实人脸和欺骗人脸之间的不同特征分布。但是很难针对无约束环境中的不同变化设计出鲁棒的特征。基于卷积神经网络(CNN)进行多模态人脸反欺骗的方法,在无约束环境下取得了良好的实验效果,但现有方法主要是多模态特征简单的拼接,没有充分利用不同模态间互补信息。本文提出一种基于自注意力网络的多模态特征融合模型。将从不同模态的图像块中提取的特征通过通道注意力网络选择有效通道特征后进行拼接,并利用自注意力网络在拼接后的多模态特征中选择对人脸反欺骗具有更多贡献的公共空间区域,最后用卷积神经网络融合三种模态的特征进行分类。CASIA-SURF数据集上的实验结果表明,与已有方法比较,本文的方法在CASIA-SURF上获得0.5%ACER的结果。
- 单位