摘要
高精度的人脸关键点定位的神经网络模型受到硬件运算能力与存储空间等计算资源的限制,无法应用到许多嵌入式设备以及移动终端中。为了降低网络模型的运算规模,基于深度可分离卷积结构,提出一种轻量级的人脸关键点定位算法。该算法在双向金字塔特征融合的基础上,增加了跨层级的特征融合路径,并对跨层级的特征进行带权融合,以充分利用backbone网络提取的有限特征。该网络模型只有10.1 MB,且在单个的NVIDIA RTX 2070 SUPER的GPU上运行,每个图像推断时间为0.147 s,806.61 M浮点运算次数。此外,模型的参数数量为3.84 M,在300-W的公共测试集中取得了5.08%的normal mean error与0.12%的failure rate。实验数据表明,与传统方法相比,该算法在运算规模上大幅减小,可以移植到嵌入式设备中进行人脸关键点识别。
- 单位