摘要
由于安防设备硬件条件等因素制约,在视频监控场景下的低清人脸检测中注重模型在检测精度、速度以及占用内存大小等方面的权衡已然是必须考虑的问题。针对此问题,将可变形卷积(Deformable convolution,DC)和Lambda层进行融合,提出一种轻型尺度自适应深度网络的低清人脸检测模型DLFace。首先借鉴RetinaFace算法,使用改进后的深度可分离卷积能够有效防止训练过程中信息丢失;其次将改进后的可变形卷积引入骨干网络和SSH(Single stage headless)检测模块,通过增强感受野适应人脸多因素的变化;最后在骨干网络高层引入Lambda层,有效挖掘语义和位置信息,形成更加丰富的特征表示。在WiderFace数据集上的实验结果表明,DLFace实现了性能和速度的平衡,在不同场景下均验证了DLFace的优越性,表明DLFace能较好地适用于视频监控场景下的低清人脸检测任务。
-
单位通信与信息工程学院; 南京邮电大学; 南京审计大学