摘要

针对于传统卷积神经网络对人脸面部表情特征提取能力不足、计算速度较慢等问题,该文提出了一种多尺度融合注意力的金字塔卷积模型。为了减少网络的参数量,提高网络的计算速度,增大模型的感受野,改进了金字塔卷积结构;为了从多尺度表示面部表情特征,提高模型对面部特征的表示能力,提出了SECA坐标注意力模块;为了节省网络的计算量,解决模型冗余的问题,促进通道间的信息融合,提出了深度可分离混洗方法。实验结果表明,该模型在公开数据集fer2013、ck+和JAFFE上的准确率分别为72.89%、98.55%和94.37%,参数量为19.58M,与其他网络对比,该文提出的网络识别效果更好、准确率更高,同时保持较快的计算速度。