摘要

针对方言特征表征能力差和识别率低的问题,兼顾特征提取和模型改进两方面对不同时长的方言语种数据进行实验仿真。首先,通过对比不同的特征提取算法,确定模型的最佳输入特征;其次,使用焦点损失代替交叉熵损失函数,对不均衡和相似度高的方言语种分配不同的权重,经实验仿真确定最优参数使模型性能达到最佳;再次,对比不同的模型在不同时长方言语种中的识别性能,实验结果显示,与基线系统相比,提出的改进模型平均识别率提升了4.09%;最后,采用语音增强方式提高模型的泛化能力和鲁棒性。