摘要
深度神经网络具有较强的非线性表达能力,可以更准确地对语音进行建模,但是通常需要大量的数据进行网络训练。在某些情况下,很难采集足够大的数据集,数据量不足会导致网络表达能力较差。针对数据量不足造成的问题,本文利用迁移学习和卷积神经网络对说话人识别工作展开研究,提出了基于迁移学习的说话人识别方法。利用大型数据库对神经网络进行训练,学习数据的通用特征,然后对网络进行微调,进而学习目标数据的深层特征,最终实现说话人识别分类。
-
单位中国刑事警察学院