摘要

为了在生猪养殖产生呼吸道疾病的初期,通过监测猪咳嗽声进行猪疾病预警,提出了基于深度神经网络-隐马尔科夫模型(DNN-HMM)构建猪声音声学模型进行连续猪咳嗽声识别的方法。利用基于小波阈值多窗谱的维纳算法进行连续猪声音去噪,并从去噪后的连续猪声音中获得了实验语料。提取39维梅尔频率倒谱系数作为实验语料的特征参数。将猪场环境下的声音分为猪咳嗽声、非猪咳嗽声和静音段。选定猪咳嗽声和非猪咳嗽声隐状态个数为5,静音段隐状态个数为3,构建含有13个隐状态的HMM模型,将连续猪声音信号特征向量作为HMM观测序列。基于实验和经验理论,采用具有3隐层,每层100个神经元的DNN模型来描述HMM模型中隐状态与观测序列之间的对应关系,通过实验,将DNN输入的上下文帧数设定为5帧。在最佳参数设置情况下,通过5折交叉验证试验进行了传统高斯混合模型-隐马尔可夫模型(GMM-HMM)与DNN-HMM的对比,试验结果表明,DNN-HMM中每组的词错误率(WER)均低于GMM-HMM,且平均WER降低3.45%。同时,DNN-HMM模型的最优WER为7.54%,平均WER为8.03%。试验结果表明,基于DNN-HMM声学模型的连续猪咳嗽声识别方法稳定可靠。