摘要
为提升文本纠错效果,本文研究了一种基于自然语言处理的纠错系统架构.通过建立语言知识库,描述自然语言的上下位关系、同义反义关系等;制定语句合成规则,构建二元句法和三元句法规则集;通过语言分析及文字错误识别功能设计,判断句子中的用词规范性,排查句子中可能存在错误的汉字串;基于自然语言处理构建纠错模型,输入文本,输出概率最大的候选串与原文相结合,得出正确的句子,完成纠错.实验结果证明,应用本文纠错系统架构后,文本错误召回率和正确率均在95.00%以上,对同音词纠错的纠正率为95.76%,长词纠错的纠正率为90.03%,证明本文设计的纠错系统架构具有一定应用价值.
-
单位闽江师范高等专科学校