深度迁移模型下的小样本声纹识别方法

孙存威; 文畅<sup>*</sup>; 谢凯; 贺建飚

doi:10.16208/j.issn1000-7024.2018.12.037

摘要

基于神经网络的生物特征识别通常需要大量训练样本,目标数据集不足使得神经网络难以获得实际应用。在小样本声纹识别中,为提高识别的准确率,结合卷积神经网络与迁移学习提出一种基于小样本的说话人识别方法。在卷积过程中引入快速批量归一化(fast batch normalization,FBN),提高深度神经网络收敛速度。将预训练模型中的全连接层改为RBM(restricted Boltzmann machine),用小样本声纹训练RBM和分类器,RBM能够进一步学习小样本声纹特有的高阶特征,消除在迁移过程中声纹数据集间的差异。选取包含400人的AISHELL-ASR0009-OS1语音数据库及实验室自采的20人语音库进行实验,实验结果表明,融合FBN的神经网络相比原始网络的训练时间减少了35.6%,最优方法相比其它两种方法识别率提高了9.7%-41.3%,验证了所提方法的可行性和有效性。

单位
长江大学; 中南大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-04-24 18:17

深度迁移模型下的小样本声纹识别方法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友