摘要
在案件侦破中,方言的辨别能提供重要线索。为了对汉语方言进行辨别,基于长短期记忆神经网络(LSTM)的方言辨识模型被提出,语音样本数据,其中包括地区口头禅,均采集于贵州省6个地区,并提取梅尔频率倒谱系数(MFCC),每份语音样本MFCC后面加上相应的地区口头禅MFCC,然后采用滑窗进行信息重叠分块,对每块分别进行横向与纵向奇异值分解并保留高贡献率的特征向量,把分块合并作为方言辨识模型的输入数据。先对LSTM进行改进,然后构建方言辨识模型。通过交叉实验对该模型进行训练和验证,从而对滑窗的宽度进行优化,同时与循环神经网络(RNN)进行比较。实验结果证明研究构建的LSTM模型对汉语方言辨识是高效的。
-
单位贵州警察学院