基于LSTM的藏语语音识别

作者:郭龙银; 扎西多吉*; 尚慧杰; 旦增
来源:电脑知识与技术, 2020, 16(04): 154-155.
DOI:10.14004/j.cnki.ckt.2020.0435

摘要

针对藏语语音识别处理的步骤,首先将藏语语料的国际音标转换,其次根据人耳对语音的处理方式,使用MFCC进行语音特征提取,再构建CNNBiLSTMCTC声学模型,最后利用2-gram语言模型进行音标与文字的转换。该文最终实现语音转文本,并在音标识别上有较好的准确率。