基于深度神经网络的成都话识别研究

作者:付婧; 李艳梅*; 陶卫国; 罗建; 李薇
来源:西华师范大学学报(自然科学版), 2020, 41(04): 440-444.
DOI:10.16246/j.issn.1673-5072.2020.04.016

摘要

随着智能语音技术的普及和各地文化的互相影响,使用方言进行人机语音交互已经成为了新的研究方向。为了在本土影视剧里能更有效标注对应的普通话字幕,针对成都话的发音特点,提出一种基于卷积神经网络的成都话识别方法,通过自建成都话语料库,构建由CNN、CTC组成的识别模型,实现了从成都话到普通话的映射识别研究。实验结果表明,使用文中方法错词率最终能降到3.23%。

全文