摘要

针对戴眼镜、人脸姿态变化以及眯眼睛等复杂场景,提出了一种基于多任务卷积神经网络(Multi Task Cascaded Convolutional Networks,MTCNN)的人眼检测算法。针对性地调整与优化网络,删除landmark部分以简化网络结构,进而调整网络的输入尺寸,使模型更适用于人眼检测。实验结果表明,基于MTCNN的人眼检测算法在数据集上准确率达92.1%,图形处理器(Graphics Processing Unit,GPU)检测速度达112 frames/s,可以有效兼顾实时性与准确性。