摘要

为了解决面向公共领域的语音识别(Automatic Speech Recognition,ASR)在识别电力巡检专有指令时识别率低的问题,提出了基于模型匹配的电力巡检语音识别后文本纠错算法。首先对庞大的电力巡检指令词库进行预处理并构造电力语法模型,建立电力词汇间的联系,然后对该模型下的电力词汇构建汉字和拼音AC自动机(Aho-Corasick Automaton,ACA)分别进行识别串精确匹配下的查错和纠错,最后针对精确匹配下纠错失败的问题设计模糊匹配算法,进一步实现语音识别后文本的模糊纠错,从而优化了电力巡检语音识别后文本纠错的性能。实验结果表明,在满足实际的应用需求的情况下,该算法解决了电力巡检语音指令词的误识别问题,显著提高了纠错正确率。