摘要
本发明提供基于视频图像场景理解的人脸自动检测方法,包括:收集人脸图片数据,进行数据标定,整理为远景人脸数据集和近景人脸数据集;基于Resnet和特征金字塔网络,搭建基于注意力机制的人脸检测神经网络;使用远景人脸数据集和近景人脸数据集分别在所述人脸检测神经网络中训练模型,得到远景人脸检测模型和近景人脸检测模型;基于对特定场景的理解,采用远景人脸检测模型和近景人脸检测模型,实现根据场景进行人脸检测。本发明通过在深度卷积神经网络中嵌入注意力机制,可以有效适应远近景条件下人脸的光照、角度、表情等变化。其次,本发明通过结合远景和近景特征不同的特性,分别训练两个模型进行检测,可以有效提高人脸检测的效果。
- 单位