摘要

本发明公开了一种基于混合域注意力与时序自注意力的方言分类方法及系统,获取N个方言语音段;将N个方言语音段进行标注得到方言标注语音数据集,数据集划分训练集、验证集与测试集;每个方言语音段进行分帧加窗变,得到该方言语音段对应的梅尔谱图,对方言语音段进行数据切片,获得不同切片对应的梅尔谱图,并为切片图谱进行位置编码;构建基于混合域注意力与时序自注意力的方言分类模型;将位置编码的切片图谱的顺序打乱后,输入方言分类模型进行迭代训练,得到训练后的方言分类模型;待分类语音段输入训练好的方言分类模型,对语音段的方言种类标签进行预测。本发明所述方法能有效增强网络对方言语音声谱区分性特征的提取能力。