摘要
通过将深度神经网络直接应用于频谱图,提出了一种用于可变长度语音段的情感识别方法。频谱图包含对情绪识别有用的对话语言信息。从频谱图中提取这些信息,并通过将卷积神经网络(CNN)与递归神经网络(RNN)相结合来完成情感识别任务。与传统的将句子分割成更小的固定长度段的方法相比,该方法可以解决语音分割过程中引入的准确性降低问题。实验结果表明,该方法在加权精度(WA)和不加权精度(UA)上均优于定长神经网络。
-
单位河南林业职业学院