基于双通道语音转图像式情感识别方法

作者:潘慧琳; 韩志艳; 王树瑞; 姜澜; 龚伟; 王雅琼
来源:电子设计工程, 2021, 29(15): 59-67.
DOI:10.14022/j.issn1674-6236.2021.15.013

摘要

情感识别是人机交互领域中必须解决的关键问题,针对用于识别的情感特征的好坏直接影响到情感识别的效果问题,提出了一种基于双通道语音转图像式的情感识别方法。通过观看影视片段获取相应情感状态下的语音信号,进行预处理,获取第一通道图像信号和第二通道图像信号,再用残差式深度卷积神经网络提取两个通道的情感特征参数,并进行组合获得组合特征参数,送入深度信念网络进行识别。该文主要研究了6种人类基本情感,分别是高兴、愤怒、惊奇、悲伤、恐惧和中性。并与采用传统特征提取方法的识别系统进行对比,实验结果表明,该文方法的平均识别正确率较传统方法提高了11.1%,而且缩短了系统的识别时间,为算法的实用性奠定了基础。

全文