基于动态BLSTM和CTC的濒危语言语音识别研究

作者:于重重; 陈运兵; 孙沁瑶; 刘畅; 徐世璇; 尹蔚彬
来源:计算机应用研究, 2019, 36(11): 3334-3337.
DOI:10.19734/j.issn.1001-3695.2018.05.0291

摘要

针对低资源的濒危语言进行了端到端语音识别模型的建立与研究,能够为濒危语言的保护和传承探索出新的途径。采用动态双向长短时记忆网络与连接时序分类模型构造端到端的语音识别系统,在进行音素级别的识别训练时,传入模型的数据批量大小根据训练模型作自适应调整,不仅能够加快收敛速度,而且能够提高模型的泛化性。通过修改网络层次与结构参数,并提取不同的语音特征进行模型对比,实验结果表明在两种濒危语言——吕苏语和土家语的数据集上均取得了较好的识别效果。

全文