基于深度神经网络的资源匮乏语言语音关键词检索

作者:张伟涛; 米吉提·阿不里米提; 郑方; 艾斯卡尔·艾木都拉
来源:现代电子技术, 2022, 45(11): 68-72.
DOI:10.16652/j.issn.1004-373x.2022.11.013

摘要

资源匮乏语言语音信息检索研究比汉语、英语等大语言进展缓慢,需要大量预处理工作。神经网络模型在低资源环境下的高效建模能力给低资源语言信息处理工作带来便利。文中以维-哈等低资源语言为基础,通过一系列预处理过程获得了这些语言的语音及文本资源,再利用高斯混合隐马尔可夫模型GMM-HMM、深度神经网络隐马尔可夫模型DNN-HMM等完成了关键词检索实验。实验结果表明,三音素下的DNN-HMM模型比GMM-HMM模型检索性能要好。维吾尔语的ATWV达到了0.368,MTWV达到了0.491,检索结果准确率达到了89.36%;哈萨克语的ATWV达到了0.382,MTWV达到了0.421,检索结果准确率达到了82.15%。

全文