摘要
为提高人脸图像情绪识别效率与准确性,在研究了深度神经网络、注意机制与损失函数基础上,提出基于上下文感知与注意机制的多学习情绪识别网络结构。该网络主要由场景特征提取、身体特征提取和融合决策3个子网络组成,并采用单双输出结构,实现多标签情绪分类及连续空间情绪回归任务。考虑到多标签情绪分类时标签的不平衡性,提出了一种改进的焦点损失函数,为小样本(难分类样本)分配更多的权重,从而提高了网络训练效率。利用EMOTIC数据集进行仿真,结果表明:平均绝对误差回归组合损失训练性能更优,分类平均准确率与回归平均误差率分别为28.5%和0.098,该方法对于小样本(难分类样本)具有更好的分类效果。
- 单位