摘要
本发明提供了一种基于注意力的语音情绪状态评估方法、装置、介质及设备。其中方法包括如下步骤:S1、搭建语音情绪状态评估模型:采用四层卷积层搭建基础骨架;每层卷积层紧接着批归一化层、RELU激活函数和平均池化操作;在第三层卷积层后接上时空注意力模块;在第四层卷积层后接上频率注意力模块;最后接上softmax层;S2、输入语音情绪数据库对语音情绪状态评估模型进行训练和测试;S3、将待评估的音频数据进行处理获取语谱图,并输入到语音情绪状态评估模型以评估出情绪状态。本发明采用轻量级的新型注意力机制,时空注意力与频率注意力相互配合,快狠准地从一段冗长的音频里提取情绪特征,有效提高情绪状态评估模型的效果和性能。
- 单位