一种基于深度稀疏自编码的语音情感迁移学习方法(英文)

作者:梁镇麟; 梁瑞宇; 唐曼婷; 谢跃; 赵力*; 王诗佳
来源:Journal of Southeast University (english Edition), 2019, 35(02): 160-167.

摘要

为了提高跨语料库的语音情感识别效率,提出了一种基于深度稀疏自编码的语音情感迁移学习方法.算法首先通过训练深度稀疏自编码器来对目标域中的少量数据进行重建,使得编码器可以学习到目标域数据低维度的结构表征.然后,将源域数据和目标域数据通过训练好的深度稀疏自编码器,得到靠近目标域低维度的结构表征的重建数据.最后,利用部分重建的含标签的目标域数据与重建的源域数据混合后共同训练分类器,以便完成对源域数据的引导.在CASIA、SoutheastLab语料库上的实验表明,通过少量数据迁移后的模型识别率在DNN上达到了89.2%和72.4%.和完整原始语料库训练的结果相比,在CASIA上仅下降了2%,在SoutheastLab上仅下降了3.4%.实验说明,该算法能够在数据集只有少量数据有标签的极端情况下,达到逼近于所有数据都有标签的效果.