摘要
针对真实视频流中的噪点、不可控的光照、人脸角度的偏转和面部遮挡及连续的人脸移动对人脸检测算法的准确性和实时性有很大影响的问题,提出一种结合卡尔曼滤波器与三级级联多任务级联卷积网络(MTCNN)深度学习网络的改进算法。该算法假设视频中人脸的运动是线性运动,通过卡尔曼滤波器预测下一帧中人脸中心点的位置,根据预测中心点位置向MTCNN网络提供下一帧推荐的检测区域,在下一帧中输入推荐区域,利用MTCNN的R-net和O-net进行再检测。通过实验验证,该算法相比原算法和其他算法在加噪情况下,保持准确率的同时提高了检测速率。
- 单位