基于端到端的多语种语音识别研究

作者:胡文轩; 王秋林; 李松; 洪青阳*; 李琳*
来源:信号处理, 2021, 37(10): 1816-1824.
DOI:10.16798/j.issn.1003-0530.2021.10.004

摘要

端到端语音识别模型无需发音词典进行训练,可以大幅降低开发新语种语音识别系统的负担。本文利用端到端模型的这一优势,建立了一种语种无关的端到端多语种语音识别系统。该模型使用基于字符的建模方法进行训练,同时构建多语种输出符号集,使其包括所有目标语言中出现的字符。模型训练生成单一模型,其网络参数为所有语种共享。在OLR竞赛提供的10个语种数据集上,相较于单语种语音识别系统,本文提出的多语种语音识别系统在所有语言上的表现都更加优秀。

全文