摘要
域自适应算法被广泛应用于跨库语音情感识别中。然而,许多域自适应算法在追求减小域差异的同时,丧失了目标域样本的鉴别性,导致其以高密度的形式存在于模型决策边界处,降低了模型的性能。基于此,提出一种基于决策边界优化域自适应(decision boundary optimized domain adaptation, DBODA)的跨库语音情感识别方法。首先利用卷积神经网络进行特征处理,随后将特征送入最大化核范数及均值差异(maximum n-norm and mean discrepancy, MNMD)模块,在减小域间差异的同时,最大化目标域情感预测概率矩阵的核范数,以提升目标域样本的鉴别性,优化决策边界。在以Berlin, eNTERFACE, CASIA语音库为基准库设立的六组跨库实验中,所提方法的平均识别精度领先于其他算法1.28%~11.01%,说明模型有效降低了决策边界的样本密度,提升了预测的准确性。
- 单位