基于Fisher混合特征和神经网络的语音鉴别方法和系统

作者:苏兆品; 季仁杰; 葛昭旭; 陈清; 郑宁军; 李顺宇; 张国富; 岳峰
来源:2019-11-19, 中国, CN201911130906.4.

摘要

本发明提供一种于Fisher混合特征和神经网络的语音鉴别方法和系统,涉及语音识别技术领域。本发明首先获取待测语音和包括智能合成语音数据与自然人声数据库数据在内的语音样本集合,再获取语音样本集合中语音样本的MFCC特征和CQCC特征;然后基于Fisher准则、MFCC特征和CQCC特征获取语音样本的MFCC-CQCC混合特征;基于混合特征和预设的神经网络获取语音鉴别模型;最后基于语音鉴别模型判断待测语音是智能合成语音还是自然人声。本发明在语音特征的选取上,没有选取单一特征,而是选用了基于Fisher准则的MFCC-CQCC混合特征,该特征有机地结合了MFCC和CQCC特征,可以有效地鉴别多种算法合成的语音,运用该混合特征训练神经网络获取语音鉴别模型,能有效提高语音鉴别模型的准确率。