摘要

对基于多场景的视听身份验证进行研究,分析特征融合的双模态身份验证策略,并引入注意力机制来实现不同模态的互补。基于SpeakingFaces数据集验证单模态识别和双模态识别对三个系统的识别效果,确认在理性和噪声条件下,双模态识别的平均错误率均低于单模态识别,由此验证所提出的双模态识别能够显著提高性能。