摘要

针对现有的头部姿态估计算法在复杂场景下实时性较差,识别率较低的问题,提出了一种多阶段特征融合的三支流头部姿态估计算法。该算法具有多级输出的结构,用三条不同类型的网络分别对输入图像进行特征提取,并且每条支流上都有三个阶段,每一阶段只需要细化前一阶段的特征,相同阶段提取出的特征图经过特征融合模块来生成特征映射,有效避免了特征丢失问题;特征提取模块选择Ghost模块作为特征提取网络,利用模型压缩,使之在保证网络精度的同时减少网络参数和计算量;为提取出重要性更强的有效特征,引入高效通道注意力模块ECA-Net,从而提升头部姿态估计的准确性。实验结果表明,所提算法在AFLW2000数据集和BIWI数据集上均取得优异的性能,对比当前诸多头部姿态估计方法,模型大小仅为0.55MB,在AFLW2000和BIWI数据集上的MAE分别降低至4.68和3.59。